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< 

(54) Bezeichnung: KONSTRUKTE UND VERFAHREN ZUR REGULATION DER GENEXPRESSION 

ON 

(57) Abstract: The invention relates to constructs and methods for the regulation of gene expression of at least two endogenous 
QO target genes by introduction of an at least partly double-stranded ribonucleic acid molecule into a eukaryotic cell or a eukaryotic 
organism, whereby the ribonucleic acid molecule comprises at least two ribonucleotide sequence sections which are homologous 
with various genes of the eukaryotic cell. 

(57) Zusammenfassung: Die vorliegende Erfindung betrifft Konstrukte und Verfahren zur Regulation der Genexpression von min- 
^5 destens zwei endogenen Zielgenen durch Einbringen eines zumindesl teilweise doppelstrangigen Ribonukleinsauremolekiils in eine 
eukaryotische Zelle oder einen eukaryotischen Organismus, wobei das RibonukJeinsauremolekul mindestens zwei Ribonukleotidse- 
quenzabschnitte umfasst, die zu verschiedenen Genen der eukaryotischen Zelle homolog sind. 
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Konstrukte xind Verfahren zur Regulation der Genexpression 



Beschreibimg . 

5. 

Die vorliegende Erfindung betrifft Konstrukte und Verfahren zur 
Regulation der Genexpression von mindestens zwei endogenen Ziel- 
genen durch Einbringen eines zumindest teilweise doppelstrangigen 
Ribonukleinsauremolekiils in eine euksuryotische Zelle oder einen 
10 exikaryotischen Organismus, wobei das Ribonukleinsauremolelcul min- 
destens zwei Ribonukleotidsequenzabschnitte umfasst, die zu ver- 
schiedenen Genen der eukaryotischen Zelle homolog sind. 

Die gezielte Inhibition der Genexpression definierter Gene ist 
15 eine der am meisten beforschten Technologie der Biotechnologie. 
Die Expression von antisense-RNA ist dabei der am haufigsten ver- 
wendet Ansatz \jnd vielfach beschrieben (u.a. EP~A1 0 458 367; 
EP-Al 0 140 3 08; van der Krol AR et al. (1988) BioTechniques 
6(10) :658-676; de Lange P et al. (1995) Curr Top Microbiol Immu- 
20 nol 197:57-75). Antisense-RNA vermittelte Ansatze haben jedoch 
den Nachteil, dass stochiometrische Mengen der antisense-RNA er- 
forderlich sind, um eine wirksame Inhibition der Ziel-mRNA zu be- 
wirken. Weitere Probleme stehen iiti Zusammenhang mit dem Einbrin- 
gen der antisense-RNA in ausreichenden Mengen in die Zellen und 
25 mit der Labilitat der antisense-PUSTA . Ansatze basierend auf anti- 
sense-RNA sind daher meist ineffizient. 



Ein weiterer Ansatz zur Genregulation ist die '^Co-Suppression" 
und meint die Verminderung der Expression eines endogenen Ziel- 

30 gens durch transgene Expression einer sense-RNA dieses Zielgens 
(EP-Al 0 465 572) . Der Co-Suppression liegen vermutlich mehr als 
ein Mechanismus zugrunde . Nachteilig ist die mangelnde Verlass- 
lichkeit und Reproduzierbarkeit des Verfahrens. In manchen Fallen 
erfolgt Suppression, wahrend in anderen Fallen - bedingt durch 

35 die Expression der sense-RNA - die erwartete Uberescpression er- 
folgt. Auch ist der erhaltene PhSnotyp oft nicht stabil. Die An- 
wendung der Co-Suppression ist im wesentlichen auf Pf lanzen be- 
schrankt . 

Verschiedene Abwandlungen der Verfahren basierend auf antisense- 
RNA Oder Cosuppression sind bekannt. So beschreibt WO 93/23551 
ein Verfahren zur Inhibition mehrerer Gene durch Expression einer 
chimaren antisense-RNA oder sense-RNA. Das Verfahren kann die lib- 
lichen mit antisense-RNA oder sense-RNA verbundenen Probleme 
nicht losen und bleibt ineffizient. 

45 

WO 98/3 6083 und WO 99/15682 beschreiben die Regulation der Genex- 
pression mittels viraler Expressionssysteme ( "virus induced gene 
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silencing" VIGS) . 

WO 99/32619 und WO 99/53050 beschreiben Verfahren zur Inhibition 
einzelner Zidlgene unter Verwendung einer RNA itiit doppelstrangi- 
5 ger Struktur, wobei das Zielgen und die Region der RNA Duplex zu- 
mindest eine teilweise Identitat aufweisen (siehe auch: Montgom- 
ery MK et al. (1998) Proc Natl Acad Sci USA 95:15502- 15507; 
Sharp PA (1999) Genes & Development 13 (2 ): 139-141; Fire A et al- 
(1998) Nature 391:806-11). Das Verfahren wird heute auch als 
10 RNA- Interference" (RNAi) bezeichnet iind hat in Mechanismus unid 
Wirkung Ahnlichkeiten mit dem oben erwahnten VIGS Verfahren. 

Die beschriebenen Verfahren, insbesondere das RNAi-Verf ahren, 16- 
sen zwar einige Probleme im Zusaramenhang mit der . Verminderung 

15 einzelner Zielgene. Fiir andere Probleme, insbesondere fur die 
parallels Suppression mehrerer Zielgene, konnte jedoch bislang 
keine bef riedigende Losung bereit gestellt werden. Zahlreiche An- 
satze in der Biotechnologie erfordem nicht nur die Verminderung 
eines einzelnen Zielgens, sondem mehrerer Zielgene, wie bei- 

20 spielsweise verschiedener Gene eines oder verschiedener Stoff- 

wechselwege oder ganzer Genfamilien. Bislang war dies nur. mit er- 
heblichen Arbeits- und Zeitaufwand zu realisieren. Die Ansatze 
erforderten oft die individuelle Regulation der einzelnen Ziel- 
gene durch sukzessive Transformation beispielsweise mit verscbie- 
denen Expressionskonstrukten, die jeweils fiir eine antisense RNA 
eines Zielgens kodierten. Neben dem erheblichen Arbeits- "und 
Zeitaufwand, besteht dabei der Nachteil, das ftlr viele Systeme 
und Organismen nur eine beschrankte Anzahl von Selektionsmarkem, 
geeigneten Promotoren etc. zur Verfugung steht, was multiple 
Trans format ionen erheblich erschwert und beispielsweise die Dele- 
tion der Marker nach der Transformation vind Selektion erfordert. 
Die mehrfache Verwendxing eines Promoters hat oft unerwunschte 
Folgen, wie beispielsweise ein epigenetisches Gene-Silencing, 
Hierbei kommt es infolge der mehrf ach verwendeten Kontrollsequen- 
zen 2u einer Inaktivierung derselben, vergleichbar der oben be- 
schriebenen Cosuppression. 

Es stellte sich also die Aufgabe, neue Verfahren bereit zu stel- 
len, die eine effiziente Verminderung der Expression mindestens 
2weier endogener Zielgene in einer eukaryotischen Zelle oder ei- 
^0 nem eukaryotischen Organismus ermoglichen. Diese Aufgabe wird 
durch die vorliegende Erfindung gelost. 

Ein erster Gegenstand der Erfindung betrifft Verfahren zur Ver- 
minderxxng der Expression von mindestens zwei verschiedenen, endo- 
ws genen Zielgenen in einer eukaryotischen Zelle oder einem eiikaryo- 
tische Organismus durch Einbringen eines z\amindest teilweise dop- 
pelstrangigen Ribonukleinsauremolekiils in besagte eukaryotische 
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Zelle Oder besagten eukaryotischen Organismus , wobei das doppel- 
strangige Ribonukleinsauremolekiil ixmfasst 



a) mindestens zwei ^'sense''-Ribonukleotidseq\ienzen, wobei jeweils 
5 mindestens eine dieser sense "-Ribonukleotidsequenzen im we- 

sentlichen identisch ist zu mindestens einem Teil des 
**sense"-RNA-Transkriptes eines jeden der besagten endogenen 
Zielgene und 

10 b) '"antisense^-Ribonukleotidseguenzen, die zu besagten 

sense "-Ribonukleotidsequenz en xrnter a) im wesentlichen kom- 
plementaren sind. 

Ein weiterer Gegenstand der Erfindung umfasst ein zumindest teil- 
15 weise doppelstrangiges Ribonukleinsauremolekul, wobei das doppel- 
strangige RibonukleinsaTiremolekul umfasst 

a) mindestens zwei sense "-Ribonukleotidsequenz en, wobei jeweils 
mindestens eine dieser sense "-Ribonukleotidsequenzen im we- 

20 sentliclien identisch ist zu mindestens einem Teil des 

^ sense "-RNA-Transkriptes eines endogenen Zielgens, wobei je- 
doch nicht alle * sense "-Ribonukleotidsequenzen zu dem 
* sense "~RNA-Transkript eines einzigen endogenen Zielgens 
identisch sind, und 

25 

b) '*antisense''-Ribonukleotidseguenzen, die zu besagten 

* sense "-Ribonukleotidsectuenzen xmter a) im wesentlichen kom- 
plementaren sind. 

30 Omfasst ist ferner die Verwendung der erf indungsgemalSen doppel- 
strangiges Ribonukleinsauremolekiil in einem der erf indungsgemSSen 
Verf ahren. 



Die vorliegende Erfindung lost die oben geschilderten Probleme 
35 und ermaglicht eine schnelle, besonders effiziente Methode zur 
Regulation der Expression verschiedener Zielgene. Insbesondere 
ergeben sich folgende Vorteile: 

a) Transgene Organismen oder Zellen, in denen mehr als ein Ziel- 
40 gen inhibiert wird, konnen in einer einzigen Transformation 

erzeugt werden. 

b) Die Transkriptionsrate fiir jeden Ribonukleotidsequenz der 
dsRNA ist gleich. Dadurch werden multiple Phanotypen durch 

45 unterschiedliche Expressionsh5hen verhindert, wie sie bei in- 

dividueller Expression separater Ribonukleotidsequenzen - 
beispielsweise durch den unterschiedlichen Ort der Insertion 



3NSDOCID: <WQ. 



.03078629A1_U> 



wo 03/078629 



PCT/EP03/02735 



4 

in das Genom - oft entstehen. Dieser Vorteil gewahrleistet 
eine gleichbleibend hohe Inhibition aller Zielgene und ver- 
mindert dramatisch die erf orderlichen Selektionsschritte zu 
Generierixng eines Organismus, bei dem alle Zielgene effizient 
5 suppriitiiert werden. 

c) Ein okonomischer Umgang mit Kontrollelementen wie Promotoren 
und Selektionsmarkern wird ermoglicht. Zudem erubrigen sich 
Probleme, wie sie bei der mehrfachen Verwendung eines be- 

10 stiinmten Kontrollelementes insbesondere eines Promoters, 

entstehen konnen Cepigenic gene silencing"). 

d) Eine Segregation der einzelnen Ribonukleotidseqrienzen bei 
nachfolgenden Ziichtungs- und Kreuzungsschritten, wie sie bei 

15 der Verwendung mehrerer Expressionskonstrukte zwangslSufig 

entsteht, wird verhindert. Dadurch wird die nachfolgende 
Ziichtiing stabiler Linien erheblich erleichtert xind beschleu- 
nigt . 

20 e) Organismen mit komplexen beispielsweise polyploide Genomen, 
wie beispielsweise manche Pflanzen, sind einer effizienten 
Gensuppression zuganglicb. Aufgrund der zahlreichen Kopien 
fur einzelne Gene sind diese Organismen klassischen verfahren 
der Mutagenese und Selektion nicht zuganglich. 

25 

Uberraschenderweise konnte bei dem erf indungsgemaiSen Verfahren 
keine storende Interferenz zwischen den einzelnen Ribonukleotid- 
sequenzabschnitte untereinander beobachtet werden. 

30 ^'Endogenes Zielgen einer eukaryotischen Zelle oder - eines eukaryo- 
tische Organismus" meint jede Nukleinsauresequenz in einer euka- 
ryotischen Zelle, eineiti eukaryotische Organismus oder einem Teil, 
Organ, Gewebe, Samen etc. desselben, 'die zur Transkription befa- 
higt ist. Dabei kann es sich um natiirlicherweise vorkommende oder 

35 aber kunstlich eingefiihrte Sequenzen (wie beispielsweise trans- 
gene Sequenzen) handeln, wobei natiirlicherweise vorkommende Se- 
quenzen bevorzugt sind. Natiirlicherweise vorkommende Secjuenzen 
sind bevorzugt und umfassen sowohl die eigenen Sequenzen der eu- 
karyotischen Zelle Oder des eukaryotischen Organismus als auch 

40 Gene von Pathogenen, die in der eukaryotischen Zelle oder dem eu- 
karyotischen Organismus nach einem Befall durch ein Pathogen pre- 
sent sind. Das Zielgen kann in der chromosomalen DNA oder der DNA 
der Organellen (wie beispielsweise der Plastiden z.B. Chloropla- 
sten etc.) lokalisiert sein oder aber sich extrachromosomal in 

45 der Zelle befinden. Die natiirlicherweise vorkommenden, eigenen 
Sequenzen des eukaryotischen Organsimus umfassen bevorzugt Gene 
desselben, die stabil im Genom vorliegen, wobei das Genom die Ge- 



BNSDCXSID: <WO ^03076628^1 J_> 



wo 03/078629 



PCT/EP03/02735 



5 

samtheit der genetischen Information meint xind sowohl die chromo- 
somale als auch die plastidare DNA imfasst. Bevorzugt ist das en- 
dogene Zielgen ein naturlicherweise in der diromosomalen DNA vor- 
kommendes Gen. Bevorzugt sind Gene deren verminderte Expression 
5 2u einem veranderten Phanotyp ftilirt. 

"Verminderimg" oder ''vermindem" der Expression eines Zielgens 
ist iiQ Zusammenliang weit auszulegen imd umfasst die teilweise 
Oder im wesentliclien vollstandige, auf xinterscliiedliche zellbio- 

10 logische Mechanismen beruhende Unterbindimg oder Blockierung der 
Expression des Zielgens oder der von ihm abgeleiteten UNA, mKNA, 
rKNA, tRNA imd/oder des dadurch kodierten Proteinproduktes in ei- 
ner. Zelle oder einem Organismus oder einem davon abgeleiteten 
Teil, Gewebe, Organ, Zelle oder Samen. Eine Verminderung im Sinjae 

15 der Erf indimg ximf asst die mengenmassige Verringerung einer vom 
Zielgen exprimierten RNA, mKNA, rRNA, tRNA und/oder des dadurch 
kodierten Proteinproduktes bis hin zu einem im wesentlichen voll- 
standigen Fehlen derselben. Dcibei wird die Expression einer be- 
stiramten RNA, mKNA, rRNA, tRNA und/oder des dadurch kodierten 

20 Proteinproduktes in einer Zelle oder einem Organismus im Ver- 
gleich zu der selben Zelle oder Organismus, die dem Verfahren 
nicht unterworfen wurden, bevorzugt \am mehr als 50%, besonders 
bevorzugt um mehr als 80%, ganz besonders bevorzugt um mehr als 
90%, am meisten bevorzugt mehr al 95% vermindert. Dabei kann die 

25 Verminderung durch dem Fachmann gelaufigen Verfahren ermittelt 
werden. So kann die Verminderung der Proteinmenge beispielsweise 
durch iramunologischen Nachweis des Proteins bestimmt werden. Wei- 
terhin konnen biochemische Techniken wie Northern-Hybridisie- 
rung, ^'nuclease protection assay". Reverse Transkription (quanti- 

30 tative RT-PCR) , ELISA ("enzyme linked immunosorbent assay"), We- 
stern-Blotting, Radioimmunoassay (RIA) oder andere Immunoassays 
sowie ^fluorescence activated cell analysis" (FACS) eingesetzt 
werden. Je nach Art des verminderten Proteinproduktes kann auch 
dess Aktivitat oder der Einfluss auf den PhSnotyp des Organismus 

35 Oder der Zelle ermittelt werden. 

Proteinmenge" meint e die Menge eines bestimmten Polypeptides in 
einem Organismus, einem Gewebe, einer Zelle oder einem Zellkom- 
partiment . 

40 

Verminderung" der Proteinmenge meint die mengenmaSige Verminde- 
rxing der Menge eines bestimmten Polypeptides in einem Organismus, 
einem Gewebe, einer Zelle oder einem Zellkorapartiment - bei- 
spielsweise durch das erf indungsgemaSe Verfahren - im Vergleich 
45 zu dem Wildtyp der selben Gattung und Art auf den dieses Verfahren 
nicht angewendet wurde, xmter ansonst gleichen Rahmenbedingungen 
(wie beispielsweise Kulturbedingungen, Alter, NShrstof f zufxahr 
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etc.). Der Verminderung betragt deJ^ei mindestens 10 %, bevorzugt 
mindestens 10% oder mindestens 20%, besonders bevorzugt ixm minde- 
stens 40% Oder 60%, ganz besonders bevorzugt um mindestens 70% 
Oder 80%, am meisten bevorzugt vm mindestens 90% oder 95%. Ver- 
5 fahren zur Bestimmung der Proteinmenge sind dem Fachmami bekamit.. 
Beispielhaft seien zu nennen: Das Mikro-Biuret Ver fahren (Goa J 
(1953) Scand J Clin Lab Invest 5:218-222), die Folin-Ciocalteu- 
Methode (Lowry OH et al . (1951) J Biol Chem 193:265-275) oder die 
Messung der Adsorption von CBB G-250 (Bradford MM (1976) Analyt 
10 Biochem 72:248-254). 

^'Verschieden" meint in Bezug auf zwei endogene Zielgene bevor- 
zugt, dass die von den beiden endogenen Zielgenen transkribierte 
HNA oder mRNA nicht identisch ist. Bevorzugt ist diie Homologie 
15 der von den beiden endogenen Zielgenen translcribierte RNA oder 
mRNA geringer als 90%, bevorzugt geringer als .80%, besonders be- 
vorzugt geringer als 70%, ganz besonders bevorzugt geringer als 
60%, am meisten bevorzugt geringer als 50% iiber jeweils die ge- 
samte L&ige der transkribierten RNA oder mRNA. 

20 

Ziomindest teilweise doppels trangiges Ribonukleinsauremolekiil " 
(infolge dsRNA) meint Ribonukleinsauremolekiil, die ganz oder 
teilweise doppelistrSngig sind. Bevorzugt ist die Ribonukleinsau- 
resequenz liberwiegend vollstandig doppels trangig. ^'Uberwiegend 

25 vollstandig doppelstrSngig" meint, dass zumindest 50%, bevorzugt 
70%, besonders bevorzugt 80%, ganz besonders bevorzugt 90% der in 
dem Molekiil vorhandenen Basen in Paarung mit einer anderen Base 
der dsRNA vorliegen oder - entsprechend der Sequenz der dsRNA und 
den Basenpaarregeln sowie gegebenenf alls einer RNA-Sek\xndarstruk- 

30 turvoraussage mittels eines geeigneten Computeralgorithmus - zu- 
mindest theoretisch vorliegen konnen. 

^'Im wesentlichen identisch meint, dass eine " sense ''-Ribonukleo- 
tidsequenz der dsRNA auch Insertionen, Deletionen sowie einzelne 

35 Punktmutationen im Vergleich zu der Sequenz des sense "-RNA- 

Transkriptes eines endogenen Zielgens aufweisen kann. Mutationen 
umfassen Substitutionen, Additionen, Deletionen, Inversion oder 
Insertionen eines oder mehrerer Basen einer Nukleinsauresequenz . 
Bevorzugt betragt die Homologie zwischen einer sense "-Ribonu- 

40 kleotidsequenz einer dsRNA und mindestens einem Teil des 

'*sense"-RNA-Transkript eines endogenen Zielgens mindestens 60 %, 
bevorzugt mindestens 70 %, ganz besonders bevorzugt mindestens 90 
%, am meisten bevorzugt 95%. Die Sequenzen konnen auch identisch 
mit der korrespondierenden Sequenz des Zielgens sein. Eine 

45 100%ige Sequenz identi tat zwischen der sense "-Ribonukleotidse- 
qiienz der dsRNA und mindestens einem Teil des sense "-Stranges 
der Transkriptes eines endogenen Gens ist bevorzugt, wenn gleich 
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nicht zwingend erf orderlich, um eine ef fiziente Verminderxong der 
Expression des endogenen Gens zu bewirken. Einzelne Mutationeri 
werden toleriert . Das Verf ahren ist demnach tolerant gegenuber 
Sequenzabweicliimgen, wie sie infolge genetischer Mutationen, Po- 
5 lymorphismen oder evolutionarer Divergenzen vorliegen konnen. So 
ist as beispielsweise auch moglich mit einer einzigen dsRNA, die 
ausgehend von einer bestimmten endogenen Gen generiert wurde, die 
Expression weiterer homologer endogener Gene des gleichen Orga- 
nismus oder aber auch die Expression homologer endogener Gene in 
10 anderen verwandten Arten zu imterdriicken. 

Unter Homologie wird das Ma& der Ubereinstimmung zwischen zwei 
Nukleotid-, Ribonukleotid- oder Proteinsequenzen verstanden, 
die bevorzugt durch Vergleich mit Hilf e des Prograitmcialgorithmus 
15 GAP (Wisconsin Package Version 10.0, University of Wisconsin, Ge- 
netics Computer Group (GCG) , Madison, USA; Altschul et al. (1997) 
Nucleic Acids Res. 25:3389ff) unter Einstellung folgender Parame-. 
ter berechnet wird: 

20 Gap Weight: 50 Length Weight: 3 

Average Match: 10 Average Mismatch: 0 

Dem Fachmann ist bewusst, dass wenn die Homologie zwischen DNA 
25 (z.B. Genen) und RNA bestimmt wird, Thymin (T) in der DNA Sequenz 
als aquivalent zu Uracil (U) in der RNA Sequenz betrachtet wird. 

"^Teil des sense ''-KNA-Transkriptes eines endogenen Zielgens*^ 
meint Fragmente einer RNA oder mRNA transkribiert von einem endo- 

30 genen Zielgen. Dabei hat besagtes Teil bevorzugt eine Sequenz- 

lange von mindestens 10 Basen, bevorzugt mindestens 25 Basen, be- 
sonders bevorzugt mindestens 50 Basen, ganz besonders bevorzugt 
mindestens 100 Basen, am meisten bevorzugt mindestens 200 Basen 
oder mindestens 300 Basen. Umfasst ist auch* die vollstSndige 

35 transkribierte RNA oder mRNA. 

Alternativ, kann eine *'im wesentlichen identische" dsRNA auch als 
Nukleinsauresequenz definiert werden, die befahigt ist, mit einem 
Teil eines Transkriptes , bevorzugt der mRNA, eines endogenen 
40 Zielgenes zu hybridisieren (z.B. in 400 mM NaCl, 40 mM PIPES pH 
6,4, 1 mM EDTA bei 50°C oder 70°C fiir 12 bis 16 h oder unter ande- 
ren Standardhybridisierungsbedingungen) , 

'"Standardhybridisierungsbedingungen" ist breit zu verstehen und 
45 meint weniger stringente als auch - bevorzugt - stringente Hybri- 
disierungsbedingungen. Solche Hybridisierungsbedingomgen sind 
imter anderem bei Scumbrook J, Fritsch EF, Maniatis T et al . , in 
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Molecular Cloning (A Laboratory Manual), 2, Auflage, Cold Spring 
Harbor Laboratory Press, 1989, Seiten 9.31-9.57) oder in Current 
Protocols in Molecular Biology, John Wiley SlSotis, N.Y. (1989) , 
6.3.1-6.3.6. beschrieben. 

5 

Beispielbaf t konnen die Bedingungen wahrend des Waschscbrittes 
ausgewahlt sein aus dem Bereich von Bedingungen begrenzt von sol- 
chen init geringer Stringenz (mit ungefahr 2X BSC bei 50°C) und - 
bevorzugt - solchen mit hoher Stringenz (mit ungefahr 0,2X SSC 

10 bei BO^'C bevorzugt bei 65°C) (20X SSC: 0,3 M Natriumcitrat , 3 M 
NaCl, pH 7.0). Dariiberhinaus kann die Tempera tur wahrend des 
Waschschrittes von niedrig stringenten Bedingungen bei Raumtempe- 
ratur, ungefahr 22°C, bis zu - bevorzugt - starker stringenten Be- 
dingungen bei ungefahr 65**C angehoben werden. Beide Parameter, 

15 Salzkonzentration und Temperatur, konnen gleichzeitig variiert 
werden, auch kann einer der beiden Parameter konstant gehalten 
und nur der andere variiert werden. Wahrend der Hybridisierung 
konnen auch denaturierende Agenzien wie zum Beispiel Formamid 
Oder SDS eingesetzt werden. In Gegenwart von 50% Formamid wird 

20 die Hybridisierung bevorzugt bei 42**C ausgefuhrt. Einige beispiel- 
hafte Bedingvmgen fiir Hybridisierung und Waschschritt sind in- 
folge gegeben: 



(1) Hybridisierungbedingxingen zum Beispiel aus nachf olgenden Be- 
25 dingungen ausgewahlt sein: 

a) 4X SSC bei 65°C, 

b) 6X SSC bei 45'^C, 

c) 6X SSC, 100 jJlg/ml denaturierter , f ragmentierte Fiscbsper- 
30 ma-DNA bei 68°C, 

f ) 50% Formamid, 4X SSC bei 42''C, 

h) 2X Oder 4X SSC bei 50**C (schwach stringente Bedingung) , 

i) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42**C (schwach* 
stringente Bedingung) . 

35 

(2) Wascbschritte konnen ziom Beispiel aus nachf olgenden Bedingun- 
gen ausgewahlt sein: 

a) 0,015 M NaCl/0,0015 M Natriumcitrat/0, 1% SDS bei SO^'C. 
40 b) 0,1X SSC bei 65°C. 

c) 0,1X SSC, 0,5% SDS bei SS^'C. 

d) 0,1X SSC, 0,5% SDS, 50% Formamid bei 42°C. 

e) 0,2X SSC, 0,1% SDS bei 42''C. 

f ) 2X SSC bei eS'^C (schwach stringente Bedingung) . 



45 



*Im wesentlichen komplementSr* meint, dass die *antisense"-Ribo- 
nxakleotidsequenzen der dsRNA auch Insertionen, Deletionen sowie 
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einzelne Pimktmutationen im Vergleich zu dem Komplement der 

sense" -Ribonukleotidsequenzen aufweisen kaim. Bevorzugt betragt 
die Homologie mindestens 80 %, bevorzugt mindestens 90 %, ganz 
besonders bevorzugt laindestens 95 %, am meisten bevorzugt 100% 
5 zwischen den ^antisense"-Ribonukleotidsequenzen und dem Komple- 
ment der sense "-Ribonukleotidsecguenzen. Komplement meint dabei - 
in der dem Fachmann gelaufigen Weise - den entsprecliend den Ba- 
senpaarregeln abgeleiteten Gegenstrang. 

-j^Q Die doppelstrangige Struktur der dsRlSFA kann ausgehend von einem 
einzigen, ganz oder teilweise selbstkomplementaren RISTA-Strang 
(bei dem die oben erwahnten sense"- und '^antisense"-Ribonukleo- 
tidsecjuenzen der dsRNA alle kovalent miteinander verbunden sind) 
Oder ausgehend von zwei RNA-Strangen (indem die oben erwatmten 
"'sense"- \ind *'antisense"-Ribonukleotidsequenzen der dsRNA auf se- 
parate Strange vorliegen) , die zueinander ganz oder teilweise . 
komplementar sind, gebildet werden. Bei zwei separaten Strangen 
konnen beispielsweise alle ''sense"-Ribonukleotidsequenzen auf dem 
einen und alle ^'antisense^-Ribonukleotidsequenzen auf dem anderen 
20 Strang vorliegen. Die Sequenzen konnen aber auch anders auf die 
beiden Strange verteilt sein. Die Ausbildung der doppelstrangigen 
Struktur kann in vitro aber auch in vivo - beispielsweise in der 
eukaryotischen Zelle selber - erfolgen. Bevorzugt liegt die dsRNA 
in Form eines einzigen, selbstkomplementaren RNA-Stranges vor. 



15 



25 



30 



35 



40 



45 



Die einzelnen sense "-Ribonukleotidsequenzen konnen mit den kor- 
respondierenden, im wesentlichen komplementaren ^antisense"-Ribo- 
nukleotidsec[uenzen eine doppelstrangige RNA-Struktur mittels Ba- 
senpaarung ausbilden und bilden eine Untereinheit der dsRNA. 

Im Falle eines selbstkomplementaren Stranges ergeben sich ver- 
schiedene Moglichkeiten fur die Primar struktur der dsRNA. Nach- 
folgend aufgefiihrte sind beispielshaf t , jedoch nicht einschran- 
kend zu verstehen: 

a) Es konnen zunachst die sense" -Ribonukleotidseciuenzen (S) der 
einzelnen Untereinheit en aneinander gefugt werden, wodrauf 
damn eine Aneinander reihung der im wesntlichen komplementaren 
^^antisense"-Ribonukleotidsequenzen (AS) folgt. Die Anzahl der 
Einheiten n ist groiSer oder gleich zwei. Es entsteht eine 
Struktur mit einer einzelnen Haamadel. Die Primarstruktur 
der dsRNA kann dabei schematisch beispielsweise wie folgt 
aussehen: 

5'-S(l)-S(2)- -S(n)-AS(n)- -AS (2) -AS (1) -3 ' 
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Die bevorzugte Sekundarstruktur ist in Pig. 2-A wiedergege- 
ben. 

b) Es konnen z\xnaclist die sense "-Ribonukleotidsequenz (S) und 
5 die im wesentlichen komplementare "antisense"-Ribonukleotid- 

sequenz (AS) der ersten Untereinheiten aneinander geftigt wer- 
den, wodrauf dann die Aneinanderreihung von ^^sense"- nnd ""an- 
tisense"-Ribonukleotidsequenzen der weiteren Untereinheiten 
folgt- Die Anzah.1 der Einheiten n ist grofier oder gleich 
10 zwei- Es entsteht eine Struktur mit mehreren Haamadeln. Die 

Primarstruktur der dsKNA kann dabei schematisch beispiels- 
weise wie. folgt aussehen: 

5'-S(l)-AS(l)-S(2)-AS(2) -S (n) -AS (n) -3 ' 

15 

Die bevorz-ugte Sekundarstruktur ist in Fig. 2-B wiedergegeben. 

Ist die dsRNA - bevorzugt - in der Lage eine Haarnadelstruktur 
auszubilden, so entspricht der Stamm der Haarnadel dem doppel- 

20 strangige Anteil der dsRNA, der durch Basenpaamng zwischen auf 
dem gleich RNA-Molekiile lokalisierten ^^sense"- und ^^antisense"- 
Ribonukleotidsequenz gebildet wird. Dabei werden "'sense*'- und 
^^antisense^-Ribonukleotidsequenzen bevorzugt durch einen '^Linker*' 
verbxinden. Der ^Linker" ist bevorzugt ein Intron, das aus der 

25 dsRNA herausgespleiEt werden kann. Selbstkomplementaren dsRNA- 
Strukturen ausgehend von eineiti einzelnen RNA-Molekiil sind bevor- 
zugt, da sie lediglich die Expression eines Konstruktes erfordern 
und die komplementaren RNA-Strange stets in einem aquimolaren 
Verbal tnis umfassen. 

30 

Bei der Verwendung eines .Linkers (I) - bevorzugt eines .Intron - 
seien nachf olgende schematische Primarstrukturen fur die dsRNA 
beispielhaft genannt: 

35 c) Dies ist eine bevorzugte Variante von a) , bei der an der 

Stelle der Haarnadelschlauf e ein Linker (I) - bevorzugt ein 
Intron - insertiert wird: 

5'-S(l)-S(2)- -S(n)-I-AS(n)- -AS (2) -AS (1) -3 ' 

40 

Die bevorzugte Selcundarstruktur ist in Fig. 2-C wiedergege- 
ben. 

d) Dies ist eine bevorzugte Variante von b) , bei der an der 
45 Stelle der jeder Haarnadelschlauf e ein Linker (I) - bevorzugt 

ein Intron - insertiert wird: 
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5'-S(l)-I-AS(l)-S(2)-I-AS(2) -S (n) -I-AS (n) -3 ' 

Die bevorzugte Sekundarstruktur ist in Fig. 2-D wiedergege- 
5 ben. 

Die dsRNA Molekiile sind jedoch auch ohne den Linker funktionell. 
Dabei ist jedoch zu beriicksichtigen, dass die letzten ca. 10 Nu- 
kleotide der tearminalen Untereinheit S(n) in diesem Fall nicht 

10 mehr korrekt paaren. In diesem Fall ist die Lange fiir diese Un- 
tereinheit urn 10 Nukleotide zu erganzen. Der Linker ist bevorzugt 
ein Intron, besonders bevorzugt ein Intron in sense-Orientierung . 
Bevorzugt handelt es sich ura ein Intron eines pf lanzlicben Gens. 
Beispielhaft jedocii nicht einschrankend seien zu nennen: Das In- 

15 tron 3 der Alkoholdehydrogenase 1 (Adhl) aus Mais (GenBank Acc- 
No.: AF044293; GI : 2828164), das Intron 4 der beta-Conglycinin 
alpha Untereinheit aus Soja (GenBank Acc.-No.: AB051865) ; eines 
der Introns des rbcS-3A Gens ftir Ribulose-1 . 5— bisphosphat carboxy- 
lase (RBC) kleine Untereinheit aus Erbse (GenBank Acc.-No. : 

20 X04333) . Diese und weitere geeignete Introns sind dem Fachiaann 
bekannt (McCullough AJ & Schuler MA (1997) Nuc Acids Res 
25:1071-1077) . Fiir die Anwendung in dem erf indungsgemaEen Verfah- 
ren wird das Intron bevorzugt in Kombination mit SpleiSakzeptor- 
und Spleifidonorsequenzen eingesetzt, die ein spateres Heraus- 

25 spleiSen aus der dsRNA ermoglichen. Diese SpleiSsequenzen konnen 
die flankirenden Sequenzen des Intron selber sein, oder aber auch 
durch dentsprechende Sequenzen der tiberigfen dsRNA bereitgestellt 
werden . 

30 Jede der einzelnen sense "-Ribonukleotidsequenzen der dsRNA ist 
im wesentlichen identisch zu laindestens ■ einem Teil des. 

sense "-RNA-Transkriptes eines endogenen Zielgens . Dabei sind je- 
doch nicht alle sense "-Ribonukleotidsequenzen zu dem 
sense "-RNA-Transkript eines einzigen endogenen Zielgens iden- 

35 tisch, sondern die jeweils maximale Identitat von mindestens zwei 
der sense "-Ribonukleotidsequenzen besteht zu den sense "-RNA- 
Transkripten von unterschiedlichen endogenen Zielgenen- Dabei be- 
tragt die Homologie zwischen den Transkripten der beiden endoge- 
nen Zielgene \inter 90%, bevorzugt \inter 80%, besonders bevorzugt 

40 unter 70%, ganz besonders bevorzugt unter 60%, am meisten bevor- 
zugt unter 50%. 

Mindestens zwei der in der erf ind\mgsgema£en dsRNA ximfassten ein- 
zelnen ^"sense'^-Ribonukleotidsequenzen sind umterschiedlich. Un- 
45 terschiedlich bedeutet zum einen, dass die Zielgene zu deren 

Trsinskripten sie die jeweils maximale Identitat aufweisen, nicht 
identisch sind, Bevorzugt vermindert mindestens eine Untereinheit 



JNSDOCID: <WO. 



.03078629A1_L> 



wo 03/078629 



PCT/EP03/02735 



12 

der dsRNA die Expression eines anderen Gens als mindstens eine 
andere Untereinheit . Unterschiedlich kauin zum anderen ancti hei- 
Een.dass die sense "-Ribonukleotidsequenzen der Untereinheit en 
selber im wesentlichen nicht identiscli sind und bevorzugt eine 
5 Homologie zu einander unter 60%, besonders bevorzugt unter 50% 
ganz besonders bevorzugt unter 40% aufweisen. Die dsRNA kann in 
einer weiteren Ausfuhrungsf orm meherer Kopien einer Untereinheit 
enthalten. Weiterhin kann die dsRNA auch mehrere verschiedene Un- 
tereinheit en enthalten, die aber gegen das gleiche endogene Ziel- 
10 gens gerichtet sind und deren « sense* -Ribonukleotidse<3uenz en bei- 
spielsweise im wesent lichen identisch sind zu unter schiedlichen 
Teilen des ^sense^'-RNA-Transkriptes des besagten endogenen Ziel- 
gens . 

15 Dabei kann jede der einzelnen ^sense'^-Ribonukleotidsequenzen auch 
zu dem Transkript mehrerer endogener Zielgene im wesent lichen 
identisch sein. Dies ist besonders dann der Fall, wenn die Ziel- 
gene uber ahnliche Sequenzabschnitte verfugen, wie es beispiels- 
weise bei Mitgliedern von Genfamilien (z.B. Speicherproteinen) 

20 der Fall ist. Dies ist eine besonders vorteilhafte Anwendxings- 

form, da - bei entsprechender Wahl der Ribonukleotidsequenz einer 
Untereinheit - besagte Untereinheit die Expression von mehr als 
einem Zielgen vermindem kann. 

25 Vorzugsweise wird die Sequenz der dsRNA so gewahlt, dass die an- 
gestrebte dsRNA Struktur nach Ausbildung der Duplex - im Ver- 
gleich zu anderen moglichen Faltxmgsvarianten der Primar struktur 
der dsRNA - die jeweils geringste freie Energie hat. Dies kann 
beispielsweise durch Vermeidung von Sequenzduplikationen etc. ge- 

30. wahrleistet werden. Die spezifische Sekundar struktur kann bei- 
spielsweise mit geeigneten Computerprogrammen vorausgesagt und 
optimiert werden (z.B. FOLDRNA; Zuker and Stiegler (1981) Nucleic 
Acids Res 9 (1) : 133-48) . 

35 Jede Untereinheit der dsRNA hat in einer bevorzugten Ausfiihrungs- 
form eine Lange von mindestens 20 Basenpaaren, bevorzugt minde- 
stens 50 Basenpaaren, besonders bevorzugt mindestens 100 Basen- 
paare, ganz besonders "bevorzugt mindestens 250 Basenpaare. 

40 In einer weiterhin bevorzugten Ausftihrxingsf orm hat jede Einheit 
eine Lange eine ganzzcJiligen Vielfachen von 21 oder 22 Basenpaa- 
ren, also beispielsweise 21, 22, 42, 43, 44, 63, 64, 65, 66, 84, 
85, 86, 87, 88, 105, 106, 107, 108, 109, 110, 126, 127, 128, 129, 
131, 132, 147, 148, 149, 150, 151, 152, 153, 154, 168, 169, 170, 

45 171, 172, 173, 174, 175, 176, 189, 190, 191, 192, 193, 194, 195, 
196, 197, 198, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219 
Oder 220 Basenpaare, bevorzugt 21, 22, 42, 44, 63, 66, 84, 88, 
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105, 110, 126, 132, 147, 154, 168, 176, 189, 198, 210 oder 220 
Basenpaare, ganz besonders bevorzugt 21, 42, 63, 84, 105, 12 6, 
147, 168, 189 Oder 210 Basenpaare, am meisten bevorzugt 180 oder 
210 Basenpaare. 

5 

Die ''sense''- und/oder ''antisense"-Ribonukleotidsequenzen der ein- 
zelnen Untereinheiten konnen direkt oder aber durch einen '* Spa- 
cer" (SP; Abstandsbalter) miteinander verbunden \ind/oder flan- 
kiert sein. Die einzelnen "^Spacer" (SP) konnen dabei identisch 

10 oder aber auch xinterschiedlich sein. Der Spacer" gentigt dabei 
bevorzugt den gleichen Langenanf orderungen wie sie oben fiir die 
Lange der Untereinheiten selber gegeben sind. Der '"Spacer" kann 
eine doppelstrange Struktur ausbilden, kann aber auch - bei- 
spielsweise in Form einer Blase - in imgepaarter Formation beste- 

15 hen, d.h. die Basen in Strang und Gegenstrang miissen nicht zwin- 
genderweise komplementar sein. Bevorzugte Ausfuhrungsf ormen sind 
zum Beispiel durch nachfolgende PrimSr struktur en beschrieben: 



20 



e) Dies ist eine bevorzugte Variante von c) : 

5 ' SP-S { 1 ) -SP-S (2 ) -SP- . . -S (n) -AS (n) -SP- . , -AS ( 2 ) -SP-AS ( 1 ) -SP-3 ' 
Die bevorzugte Sekundar struktur ist in Fig. 3-A wiedergege- 



ben, 



25 



Der ^Spacer" kann weitere Funktionselemente umfassen. Beispiel- 
haft jedoch nicht einschrankend sind zu nennen: 

i) Sequenzen kodierend fiir eine von einem Ribozym als Substrat 
30 erkannten Erkennungssequenz (RE) . Beispielsweise kann die 

dsKNA nachfolgende lineare Struktur vor der Faltung einneh- 
men: 



5'-S(l)-(RE) -S(2)-. . .-S(n)-AS(n)-. . -AS (2 ) - (RE) -AS { 1) -3 ' 



35 



Die bevorzugte Sekundar struktur ist in Fig. 3-B wiedergege- 
ben. Das entsprechende Ribozym (R) kann separat exprimiert 
werden kann aber auch auf der dsRNA selber kodiert sein. Da- 
bei ist die Sequenz kodierend fur ein Ribozym bevorzugt so 
40 angeordnet, dass sie im gefalteten dsRNA Molekiil einer Se- 

quenz gegenuber liegt, die fiir dieses Ribozym als Substrat 
fungieren kann. Beispielsweise kann die dsRNA nachfolgende 
lineare Struktur vor der Faltung einnehmen: 

45 5'-S(l)-(R) (RE)-S(2)-. . . -S (n) -AS (n) - . .-AS(2)-(R) {RE)-AS(l)-3 
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Die bevorzugte Sekundarstruktvir ist in Fig. 3-C wiedergege- 
ben. Durch die genannten Ausf uhxungsf ormen werden nach Tran- 
skription die einzelnen Untereinheiten durch Wirkuxig des Ri- 
bozym voneinander getreimt. Diese Trennxmg ist vorteilhaft, 
5 jedoch nicht zwingend erf orderlich. Entsprechend nutzbare Ri- 

. bozyme und Erkenniangssequenzen sind dem Fachmann bekannt . 

Ribozyme meint katalytische RNA-Molekiile. Ribozyme konnen an 
jede beliebige Ziel-RNA angepasst werden \md spalten das 

10 Phospbodiester-Geriist an spezifischen Positionen, wodurcb die 

Ziel-RNA funktionell deaktiviert wird (Tanner NK (1999) FEMS 
Microbiol Rev 23 (3 ): 257-275 ) . Das Ribozym wird dadurch nicht 
selber modif iziert , sondern ist in der Lage, weitere Ziel- 
RNA-Molekiile analog zu spalten, wodurch es die Eigenschaf ten 

15 eines Enzyins erhSlt, Der Einbau von Ribozymsequenzen in '^an- 

tisense^-RNAs verleiht eben diesen "^antisense'^-RNAs diese en- 
zymahnliche, RNA-spaltende Eigenschaf t und steigert so deren 
Effizienz bei der Inaktivierxmg der Ziel-RNA. Die Herstellimg 
und Verwendung entsprechender Ribozym- "antisense" -RNA-Mole- 

20 kiile ist beispielsweise beschrieben bei Haseloff et al. 

(1988) Nature 334: 585-591. Auf diese Art konnen Ribozyme 
(z.B. "^Hammerhead" -Ribozyme; Haselhoff und Gerlach (1988) Na- 
ture 334:585-591) verwendet werden, um die eines bestimmte 
RNA katalytisch zu spalten. VerfsJiren zur Expression von Ri- 

25 bozymen zur Verminderung bestimmter Proteine sind beschrieben 

in (EP 0 291 533, EP 0 321 201, EP 0 360 257). In pflanzli- 
chen Zellen ist eine Ribozym-Expression ebenfalls beschrieben 
(Steinecke P et al. (1992) EMBO J 11 (4) : 1525-1530; de Feyter 
R et al. (1996) Mol Gen Genet. 250 (3 ): 329-338) . Geeignete 

30 Zielsequenzen \md Ribozyme konnen zum Beispiel wie bei ^Stei- 

necke P, Ribozymes, Methods in Cell Biology 50, Galbraith et 
al. eds. Academic Press, Inc. (1995), 3.449-460" beschrieben, 
durch Sekundarstrukturberechnungen von Ribozym- und Ziel— RNA 
sowie durch deren Interaktion bestimmt werden (Bayley CC et 

35 al- (1992) Plant Mol Biol. 18 (2 ): 353-361; Lloyd AM and Davis 

RW et al. (1994) Mol Gen Genet. 242 ( 6 ): 653-657 ) . Beispiels- 
weise konnen Derivate der Tetrahymena •L-19 TVS RNA kon- 
struiert werden, die komplementare Bereiche zu der mRNA des 
zu den Spacers equenz en aufweisen (siehe auch US 4,987,071 und 

40 US 5,116,742). Alternativ konnen solche Ribozyme auch liber 

einen Selektionsprozess aus einer Bibliothek diverser Ribo- 
zyme identif iziert werden (Bartel D und Szostak JW (1993) 
Science 261:1411-1418). 

45 ii) Sequenzen kodierend fur Erkennungsseqiienzen fur RNAasen 

Der ^'Spacer" kann Erkenniingssequenzen fur RNAsen, bevorzugt 
seguenzspezif ische RNAsen wie beispielsweise RNAse IIX ent- 
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halten. RNAse III schneidet am Motiv S'-AGNN-B, wenn vier 
dieser Motive in einer Schleife vorhanden sind (Nagel R & 
Ares M (2000) RNA 6:1142-1156). Die RNase kann eine pflanze- 
neigene RNAse sein, oder - wie beispiuelsweise fiir bakte- 
5 rielle RNase III Proteine - auch transgen exprimiert werden. 

iii) Seqrienzen kodierend fiir IntronspeiEsignale (IS) . Dabei sind 
die Splei£donor und SpleiEakzeptorsequenzen bevorzugt so lo-- 
kalisiert, dass jeweils die Untereinbeit als Intron beraus- 
10 . gespleiiSt wird. IntronspleiSsignale sind in Meritt at 

al.(1997) Plant Journal 12:937-943 oder in Egoavil et al. 
(1997) Plant Journal 12:971-980 bescbrieben. 

Die dsRNA bzw. ihre VorlSuf ermolekiile konnen auf verschiedene dem 

15 Fachmann gelaufige Weise in einen Organismus oder eine Zelle ein- 
gebracbt werden. ^'Einbringen"- ist^breit zii verstehen iirid umfasst 
im Rahmen der Erfindung alle Verfabren, die dazu geeignet eine 
dsRNA bzw. ihre Vorlauf enaolekule, direkt oder indirekt, in einen 
Organismus oder eine Zelle, Kompartiment , Gewebe, Organ oder Sa- 

20 men desselben einzuf uliren oder dort zu generieren. Die Einbrin- 
gung kann zu einer vorubergehenden ( transienten) Prasenz einer 
dsRNA fiihren oder aber auch zu einer dauerhaften (stabilen) . Um- 
fasst sind Verfahren der direkten Transfektion oder Transforma- 
tion der Zelle mit der als auch die Transformation oder Trans- 

25 fektion der Zelle mit Expressionskassetten, die befahigt sind, 
die der dsRNA zugrundeliegenden Ribonukleinsauresequenzen in der 
Zelle zu exprimieren (infolge dsRNA-Expressionssystem) . Die Ex- 
pression der dsRNA kann transient oder - beispielsweise nach In- 
tegration in das Genom des Organismus - permanent erfolgen. Die 

30 Duplex-Bildung der dsRNA kann entweder aufierhalb der Zelle oder 
innerhalb derselben initiiert werden. 

Die dsRNA wird in einer Menge eingefuhrt, die zurnindest eine Ko- 
pie pro Zelle ermoglicht. Hobere Mengen (z.B. mindestens 5, 10, 

35 100, 500 Oder 1000 Kopien pro Zelle) konnen ggf . eine effizienter 
Verminderung der Expression der Zielgene bewirken. Da dsRNA eine 
aulSerordentlich gute Mobilitat innerhalb eines Organismus hat, 
ist es nicht zwingend erforderlich die dsRNA in jede Zelle des 
Organismus zu applizieren. Es ist ausreichend, die dsRNA in eine 

40 Oder wenige Zellen einzxibringen oder zu exprimieren, wobei die 

erf indungsgem§.6e Wirkung dann auch in anderen Zellen des gleichen 
Organismus erzielt werden kann. 

Eine dsRNA - beispielsweise zur Verwendung in einer direkten 
45 Trans foarmat ion oder Trajcisf ektion - kann kann In vivo oder in vi- 
tro, durch enzymatische , molekularbiologische oder chemisch— syn- 
thetische Verfahren synthetisiert werden. Dazu konnen eukaryoti- 
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sclie, prokaryotische oder Bakteriophagen RNA Polymerasen (wie 
z.B. T3-, T?- Oder SP6 RNA-Polymerase) verwendet werden. Entspre- 
chende Verfahren zu in vitro Expression von RNA sind beschrieben 
(WO 97/32016; US 5,593,874; US 5,698,425, US 5,712,135, US 
5 5,789,214, US 5,804,693). Eine chemisch oder enzymatisch in vitro 
synthetisierte dsRNA kann vor der Einftihrung in eine Zelle, Ge- 
webe oder Organismus aus dem Reaktionsgemisch beispielsweise 
durch Extraktion, Prazipitation, Elektropliorese, Chromatograpliie 
Oder Kombinationen dieser Verfahren ganz oder teilweise auf gerei- 

10 nigt werden. Die dsRNA kann direkt in die Zelle eingefiihrt werden 
(beispielsweise durch Partikelbeschufi oder Mikroinjektion) oder 
aber extrazellular (z.B. in den interstitial Raum, das GefaSsy- 
stem, das Verdauiings system o.a.) appliziert werden. Auch eine Ap^ 
plikation beispielsweise von dsRNA exprimierenden Organismen in 

15 Form von Nahrung ist denkbar. Es ist bekannt, dass dsRNA eine 
gute Zellgangigkeit und ausreichende Stabilitat hat. Durch die 
hohe Wirksamkeit der dsRNA sind auch wenige Molekiile ausreichend, 
um eine gute Wirkung im Sinne der Erfindung zu erzielen. 

20 Es konnen femer Modif ikationen sowohl des Zucker-Phosphat-Gerii- 
stes als auch der Nukleoside in der dsRNA vorliegen. Beispiels- 
weise konnen die Phosphodiesterbindungender der RNA dahingehend 
modifiziert sein, dass sie zumindest ein Stickstoff oder Schwe- 
fel-Heteroatom umfassen. Basen konnen dahingehend modifiziert 

25 werden, dass die Aktivitat beispielsweise von Adenosindeaminase 
eingeschrankt wird. Die dsRNA kann enzymatisch oder ganz oder 
teilweise chemisch-synthetisch hergestellt werden. 

Bevorzugt wird die dsRNA jedoch ausgehend von entsprechenden Ex- 
30 pressionssystemen in der Zelle exprimiert. Ein weiterer Gegen- 
stand der Erfindung betrif f t ' besagte dsRNA-Expressionssysteme . 
Wird die dsRNA als ein einzelner, selbstkomplementaren RNA-Strang 
exprimiert, so umfasst das Expressionssystem eine Expressionskas- 
sette mit einer fiir den selbstkomplementaren RNA-Strang kodieren- 
35 den DNA Sequenz in funktioneller Verkniipfimg mit einen Promotor, 
der geeignet ist, die Expression in der jeweiligen eukaryotischen 
Zelle zu gewahrleisten. Optional kann die Expressionskassette 
weitere funktionelle Elemente wie beispielsweise Transkriptions- 
terminatoren und/ oder Polyadenylierungssignale umfassen. Derar- 
40 tige Expressionskassetten sind ebenfalls Gegenstand der Erfin- 
dung. 

Wird die dsRNA in Form von zwei separaten Strangen exprimiert, 
die zueinander gaxiz oder teilweise komplementar sind, so umfasst 
45 das Expressionssystem zwei Expressionskassetten, wobei jeder der 
beiden StrSnge in funktioneller Verkntipfung mit einen Promotor 
steht, der geeignet ist, die Expression in der jeweiligen euka- 
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ryotischen Zelle zu gewahrleisten. Optional konnen die Expres- 
sionskassetten weitere fimktionelle Elemente wie beispielsweise 
Translcriptionsterminatoren und/oder Polyadenylienmgssignale um- 
fassen. Die Kombination der beiden Expressionskassetten zu dem 
5 erf indxingsgemaSen Express ions system kann auf verschiedene dem 
Fachmann gelaufige Art geschehen. Beispielhaft seien zu nennen: 

a) Transformation der Zelle oder Pflanze mit einem Vektor, der 
Expressionskassetten fur beide KNA-Strange umfasst, 

10 

b) Kotrans formation der Zelle oder Pflanze mit zwei Vektoren, 
wobei jeweils ein Vektor ftir jeweils einen der beiden Strange 
der dsRNA kodiert. 

15 c) Kreuzung von zwei Pflanzen, die mit jeweils einem Vektor 

transf ormiert wurden, wobei. jeweils ein Vektor ftir jeweils 
einen der beiden Strange der dsRNA kodiert . 

Es ist auch moglich, das eine Expressionskassette einzusetzten, 
20 bei der die fiir die dsRNA kodierende DNA-Sequenz zwischen zwei 

Promotoren mit entgegengerichteter Transkriptionsrichtung lokali- 
siert ist und so von beiden Seiten transkribiert wird. 

Expressionskassette meint chimare DNA-Molekiile in denen eine fur 
25 das dsRNA-Molekiil (bzw. fiir einen der Strange desselben) kodie- 
rende Nukleinsauresequenz mit mindestens einem genetischen Kon- 
trollelement (beispielsweise einem Promo t or ^ Enhancer, Silencer, 
Splice-Donor oder -Akzeptor, Polyadenylierungssignal) derart ver- 
kniipft ist, das die Transkription des dsRNA-Molekiils (bzw. eines 
30 der Strange desselben) in der eukaryotischen Zelle oder Organis- 
mus gewShrleistet ist. Entsprechend vorteilhafte Konstruktionen 
sind weiter unten beschrieb. Eine Polyadenylierung ist m5glich, 
jedoch nicht erf orderlich, ebenso mussen keine Elemente zur ±n- 
itiierxing einer Translation vorbanden sein. 

35 

Soil das Expressionskonstrukt in eine Pflanze eingefiihrt und die 
dsRNA in plantae erzeugt werden, so sind pf lanzenspezif ische ge- 
netische Kontrollelemente (beispielsweise pf lanzenspezif is.che 
Promotoren) bevorzugt. Die dsRNA kann jedoch auch in anderen Or- 
40 ganismen oder in vitro erzeugt xmd dann in die Pflanze einge- 
bracht werden. 

Unter einer funktionellen Verknupfung versteht man zum Beispiel 
die sequentielle Anordnung eines Promoters mit der zu transkri- 
45 bierenden Nukleinsauresequenz und ggf . weiterer regulativer Ele- 
mente wie zvm Beispiel einem Terminator und/oder Polyadenylie- 
rungssignalen derart, dass jedes der regulativen Elemente seine 
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Funktion bei der Transkription der Nukleinsaiiresequenz , je nach 
Anordniing der Nukleinsauresequenzen erfxillen kann. Dazu ist nicht 
unbedingt eine direkte Verkniipfung im cheitiischen Sinne erf order- 
lich. Genetische Kontrollsecjueiizen, wie zum Beispiel Enhancer-Se- 
5 quenzen, konnen ihre Funktion auch von weiter entfernten Positio- 
nen oder gar von anderen DNA-Molekiilen aus auf die Zielseqiaenz 
ausuben. Bevorzugt sind Anor dnungen , in denen die zu transkribie- 
rende Nukleinsauresequenz hinter der als Promoter fiangierenden 
Sequenz posit ioniert wird, so dass beide Sequenzen kovalent mit- 

10 einander verbxinden sind. Bevorzugt ist dabei der Abstand zwischen 
der Promotorsequenz und der transgen zu exprimierende Nukleinsau- 
resequenz geringer als 200 Basenpaare, besonders bevorzugt klei- 
ner als 100 Basenpaare, ganz besonders bevorzugt kleiner als 50 
Basenpaare. In einer bevorzugten Ausfulirungsf orm wird die zu 

15 transkribierende Nukleinsauresequenz so hinter dem Promotor loka- 
lisiert, das der Transkriptionsstart identisch ist mit dem ge- 
wunscbten Beginn der dsRNA, ■ .: . 

Die Herstellung einer funktionellen Verkniipfung als auch die Her- 
20 stellung einer Expressionskassette kann mittels gangiger Rekom- 
binations- und Klonierungstechniken realisiert werden, wie sie 
beispielsweise in Maniatis T, Fritsch EF und Sambrook J (1989) 
Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labo- 
ratory, Cold Spring Harbor (NY), in Silhavy TJ, Berman ML und En- 
25 quist LW (1984) Experiments with Gene Fusions, Cold Spring Harbor 
Laboratory, Cold Spring Harbor (NY), in Ausubel FM et al. (1987) 
Current Protocols in Molecular Biology, Greene Publishing Assoc. 
and Wiley Inter science und bei Gelvin et al . (1990) In: Plant Mo- 
lecular Biology Manual beschrieben sind. 

30 

Unter einer Expressionskassette sind aber auch solche Konstruk- 
tionen zu verstehen, bei denen zum Beispiel eine Nukleinsaurese- 
quenz kodierend ftir eines dsRNA der art hinter einen endogenen . 
Promoter platziert werden, dass der gleiche Effekt auftritt, 
35 Beide Ansatze fuhren zu Expressionskassetten im Sinne der Eirfin- 
dung 

Prinzipiell konnen alle natiirlichen Promotoren mit ihren Regula- 
tions sequenzen wie die oben genannten fur das erf indungsgemasse 
40 Verfahren verwendet werden, solange sie die Expression in dem 

Zielorganismus gewahrleisten. Daruberhinaus koiHien auch syntheti- 
sche Promotoren vorteilhaft verwendet werden. 



45 
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Es konnen weitere Promotoren f unktionell mit der zu expirimieiren- 
den Nukleinsauresequenz verkniipft sein, die eine Expression in 
weiteren Eukaryoten oder in Prokaryoten, wie zum Beispiel E.coll 
Bakterien ermoglichen. 

5 

Die in den erf indungsgemassen Expressionskassetten oder Vektoren 
enthaltenen Nukleinsauresequenzen konnen itiit weiteren genetischen 
Kontrollsequenzen neben einem Promoter funktionell verknupf t 
sein. Der Begriff der genetischen Kontrollsequenzen ist breit zu 

10 verstehen lond meint all solche Sequenzen, die einen Einfluss auf 
das Zustandekommen oder die Funktion der erf indungsgemassen Ex-- 
pressionskassette haben. Genetische Kontrollsequenzen modifizie- 
ren zum Beispiel die Transkription in prokaryotischen oder euka- 
ryotischen Organismen. Vorzugsweise ixnafassen die erf indungsgCTcias- 

15 sen Expressionskassetten 5 ' -stromaufwSrts von der jeweiligen 

transgen zu exprimierenden Nukleinsauresequenz einen pflanzenspe- 
zifischen Promoter und 3 ' -stromabwarts eine Terminatorsequenz als 
zus3.tzliche genetiscbe Kontrollsequenz , sowie gegebenenf alls wei- 
tere ^ibliche regulative Elemente, und zwar jeweils fvtnktioixell 

20 verknupf t mit der transgen zu exprimierenden Nukleinsauresequenz - 

Genetische Kontrollsequenzen xamfassen ferner auch die 5 ' -untrans- 
latierte Regionen, Introns oder nichtkodierende 3 '-Region von Ge- 
nen. Es ist gezeigt worden, dass diese eine signifikante Funktio- 
25 nen bei der Regulation der Genexpression spielen konnen. Kon- 
trollsecjuenzen umfassen ferner Polyadenylierungssignale sowie 
Terminatorsequenzen . 

Die Expressionskassette kann vorteilhaf terweise eine oder mehxere 
30 sogenannte "enhancer Sequenzen" funktionell verknupf t mit dem 

Promoter enthalten, die eine erhohte transgene Expression der Nu- 
kleinsauresequenz ermoglichen. Auch am 3'— Ende der transgen zu 
exprimierenden Nukleinsauresequenzen konnen zusatzliche vorteil- 
hafte Sequenzen inseriert werden, wie weitere regulatorische Ele- 
35 mente oder Terminatoren. Die transgen zu exprimierenden Nuklein- 
sauresequenzen konnen in einer oder mehreren Kopien im Genkon- 
strukt enthalten sein. 

Als Kontrollsequenzen sind weiterhin solche zu verstehen, die 
40 eine homologe Rekombination bzw. Insertion in das Genom eines 

Wirtsorganismus ermoglichen oder die Entf emung aus dem Genom er- 
lauben. Methoden wie die cre/lox-Technologie erlauben eine gewe- 
bespezif ische, unter Umstanden induzierbare Entfernxmg der Ex- 
pressionskassette aus dem Genom des Wirtsorganismus (Sauer B 
45 <1998) Methods. 14 (4) :381-92) . Hier werden bestimmte flankierende 
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Sequenzen dem Zielgen Eingefugt (lox-Seqxienzen) , die spater eine 
Entfemung mittels der cre-Rekombinase ermoglichen. 

Bevorzugt kann die Expressionskassette, bestehend aus einer Ver- 
5 kntipf\ing von Promoter und zu transkribierender Nukleinsaurese- 
q[uenz, integriert in einem Vektor vorliegen und durch zum Bei- 
spiel Transformation - nach einem der unten beschriebenen Verfah- 
ren - in die eukaryotische Zelle oder Organismus eingebracht wer- 
den. Die nacbf olgende Expression kann transient sein oder aber 

10 auch - bevorzugt - stabil nach Insertion (beispielsweise unter 
Verwendung von Selektionsmarkern) der Expressionskassetten in das 
Genom erfolgen. Bevorzugt wird das dsRNA-Express ions system stabil 
in das Genom - beispielsweise die chromosomale DNA oder die DNA 
der Organellen (z.B. der Plastiden, Mitochondrien etc.) - einer 

15 Zelle integriert. 

Die Einfiihrung einer erf indungsgemassen transgenen Expressions- 
kassette in einen Organismus oder Zellen, Geweben, Organe, Telle 
bzw. Samen desselben (bevorzugt in Pflanzen bzw, pflanzliche Zel- 

20 len, Gewebe, Organe, Telle oder Samen) kann vorteilhaft unter 
Verwendung von Vektoren realisiert werden, in denen die transge- 
nen Expressionskassetten enthalten sind. Vektoren konnen bei- 
spielhaft Plasmide, Cosmide, Phagen, Viren oder auch Agrobakte- 
rien sein. Die transgenen Expressionskassetten konnen in den Vek- 

25 tor (bevorzugt ein Plasmidvektor) uber eine geeignete Restrikti- 
onsschnittstelle insertiert werden. Der entstandene Vektor wird 
zunachst in E.coli eingef uhrt . Korrekt transf ormierte E.coli wer- 
den selektioniert , geztichtet und der rekombinante Vektor mit dem 
Fachm^nn gel§.ufigen Methoden gewonnen. Restriktionsanalyse uxid 

30 Sequenzierung konnen dazu dienen, den Klonierungsschritt zu iiber- 
priifen. Bevorzugt sind solche Vektoren, die eine stabile Integra- 
tion der Expressionskassette in das Wirtsgenom ermoglichen. 

Die Herstellung eines transf ormier ten Organismus (bzw. einer 
35 transf ormierten Zelle oder Gewebes) erfordert, dass die entspre- 
chende DNA (z.B. der Expressionsvektor) oder RNA in die entspre- 
chende Wirtszelle eingebracht wird. FOr diesen Vorgang, der als 
Transformation (oder Transduktion bzw. Transf ektion) bezeichnet 
wird, steht eine Vielzahl von Methoden zur Verfiigung (Keown et 
40 al. (1990) Methods in Enzymology 185:527-537). So kann die DNA 
Oder RNA beispielhaf ]t direkt durch Mikroinj ektion oder durch Bom- 
bardiening mit DNA-beschichteten Mikropartikeln eingefiihrt wer- 
den. Auch kann die Zelle chemisch, zum Beispiel mit Polyethylen- 
glycol, permeabilisiert werden, so dass die DNA durch Diffusion 
45 in die Zelle gelangen kann. Die DNA kann auch durch Protopla- 
stenfusion mit anderen DNA-enthaltenden Einheiten wie Minicells, 
Zellen, Lysosomen oder Liposomen erfolgen. Elektroporation ist 
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eine weitere geeignete Methode zur Einfxilirimg von DNA, bei der 
die Zellen reversibel durch einen elektrischen Impuls permeabili- 
sert warden. Entsprechende Verfaliren sind beschrieben (beispiels- 
weise bei Bilang et al . (1991) Gene 100:247-250; Scheid et al. 
5 (1991) Mol Gen Genet 228:104-112; Guerche et al. (1987) Plant 
Science 52:111-116; Neutiause et al . (1987) Theor Appl Genet 
75:30-36; Klein et al . (1987) Nature 327:70-73; Howell et al . 
(1980) Science 208:1265; Horsch et al.(1985) Science 
227:1229-1231; DeBlock et al. (1989) Plant Physiology 91:694-701; 
10 Methods for Plant Molecular Biology (Weissbach and Weissbach, 

eds.) Academic Press Iiic. (1988); and Methods in Plant Molecular 
Biology (Schuler and Zielinski, eds.) Academic Press Inc. 
(1989)). 

15 Ein weiterer Gegenstand der Erfindung betrif f t Zellen, die eines 
der erf indungsgema£en dsRNA Molektile, Express ionssysteme, Expres- 
sionskassetten oder Expressionsvektoren enthalten. Die Zelle kann 
von einem Organismus abgeleitet oder in diesem enthalten sein, 
meint aber auch einzellige Organismen wie Mikroorgamismen. Die 

20 Zelle kann prokaryotisch oder eukarypotischer Natur sein. Wobei 
das erf indiingsgemaSe Verfahren auf eukaryotische Organismen ange- 
wendet wird. Dennoch konnen prokaryotische Organismen die erfin- 
dungsgemafien Expressionssysteme beispielsweise zum Zwecke der 
dsRNA-Produktion enthalten. Auch konnen prokaryotische Organis- 

25 men, beispielsweise Agrobakterien, vorteilhaft als Vehikel fiir 
die Transformation beispielsweise- pflanzlicher Organismen einge- 
setzt wer.den. 

Bevorzugte Prokaryoten sind vor allem Bakterien wie Bakterien der 
30 Gattxing Escherichia, Corynebacterium, Bacillus, Clostrridium, 

Proionibacteri\jm, Butyrivibrio , • Eubacteifium, Lactobacillus, Erwi- 
nia, Agrobacterium, Flavobacterium, Alcaligenes, Phaeodactylum, 
Colpidium, Mortierella, Entomophthora, Mucor, Crypthecodiniiam 
oder Cyanobakterien zum Beispiel der Gattvmg Synechocystis . Be- 
35 vorzugt sind vor allem Mikroorganismen, welche zur Infektion von 
Pflanzen und damit zur tJbertragung der erf indungsgemassen Kon- 
strukte befahigt sind, Bevorzugte Mikroorganismus sind solche aus 
der Gattung Agrobacterium und insbesondere der Art Agrobacterium 
tumef aciens . 

40 

Eukaryotische Zellen und Organismen umfasst pflanzliche und tie- 
rische, nicht-menschliche Organismen und/oder Zellen sowie euka- 
ryotische Mikroorganismen wie beispielsweise Hefen, Algen oder 
Pilze. Eine entsprechender transgener Organismus kann beispiels- 
45 weise durch Einftihrung der entsprechenden Expressionssysteme in 



NSDOCID: <WO 0307e62gA1J_> 



wo 03/078629 



PCT/EP03/02735 



22 

eine Zygote, Stammzelle, Protoplast oder eine andere geeignete 
von dem Organismus abgeleitete Zelle hergestellt warden. 

^^Tierische Organismus" meint nicht-inenschliche Vertebraten oder 
5 Invertebraten . Bevorzugte Vertebraten \uafassen beispielsweise Fi- 
scharten, nicht-menschliche Saugetiere wie Rind, Pferd, Schaf , 
Ziege, Maus, Ratte oder Schwein, sowie Vogel wie Hulm oder Gans . 
Bevorzugte tierische Zellen umfassen CHO, COS, HEK293 Zellen. In- 
vertebraten lunfassen Nematoden oder andere Warmer sowie Insekten. 
10 Invertebraten umfassen Insektenzellen wie Drosophila S2 xmd Spo- 
doptera Sf9 oder Sf21 Zellen. 

Bevorzugt sind ferner Nematoden, die in der Lage sind Tiere oder 
Menscben zu befallen, wie solche der Gattungen Ancylostoma, Asca- 

15 ridia, Ascaris, Bunostomum, Caenorhabditis , Capillaria, Chaber- 
tia, Cooperia, Dictyocaulus , Haemoncbus, Heterakis, Nematodirus, 
Oesopbagostomum, Ostertagia, Oxyuris, Parascaris, Strongylus, To- 
xascaris, Tricburis, Tricbostrongylus, Tfbcbonema, Toxocara oder 
Uncinaria. Femer bevorzugt sind solche, die in der Lage sind * 

20 pflanzliche Organismen zu befallen wie beispielsweise Bursapba- 
lenchus, Criconemella, Diiylenchus, Ditylenchus, Globodera, Heli- 
cotylenchus, Heterodera, Longidorus, Melodoigyne, Nacobbus, Para* 
tylenchus, Pratylencbus , Radopbolus, Rotelynchus, Tylenchus oder 
Xiphinema. Bevorzugte Insekten umfassen solche der Gattungen Co- 

25 leoptera, Diptera, Lepidoptera und Homoptera. 

Bevorzugte Pilze sind Aspergillus, Trichoderma, Ashbya, Neu~ 
rospora, Fusarium, Beauveria oder weitere in Indian Chem Engr. 
Section B. Vol 37, No 1,2 (1995) auf Seite 15, Tabelle 6 be- 
30 schriebene Pilze. Besonders bevorzugt ist der filamentose Hemia- 
scomycet Ashbya gossypii. • . 

Bevorzugte Hefen sind Candida, Saccharomyces , Hansenula oder Pi- 
chia, besonders bevorzugt sind Saccharomyces cerevisiae oder Pi- 
35 chia pastoris (ATCC Accession No. 201178) . 

Als transgene Organismen bevorzugt sind vor allem pflanzliche Or- 
ganismen. *'Pf lanzlicher Organismus" \jmfasst jeden Organismus, der 
zur Photosynthese befahigt ist, sowie die von diesem abgeleitete 

40 Zellen, Gewebe, Telle oder Vermehrungsgut (wie Samen oder 

Frtichte) . Eingeschlossen sind im Rahmen der Erfindxang alle Gat- 
timgen und Arten hdherer xind niedrigerer Pflanzen des Pf lanzen- 
reiches. Einjahrige, mehrjahrige, monocotyledone und dicotyledone 
Pflanzen sowie Gymnospermen sind bevorzugt. Eingeschlossen sind 

45 reife Pflanze, Saatgut, Sprosse und Keimlinge, sowie davon abge- 
leitete Telle, Vermehrungsgut {zvm Beispiel Knollen, Samen oder 
Friichte) und Kulturen, zum Beispiel Zell- oder Kalluskulturen. 
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Reife Pflanzen meint Pflanzen zu jedem beliebigen Entwicklungs- 
stadiim jenseits des Keimlings. Keimling meint eine jimge, un- 
reife Pflanze in einem friihen EntwickliingsstadiTxm. 

5 "Pflanze" im Rahmen der Erfindiing meint alle Gattungen und Arten 
hoherer und niedrigerer Pflanzen des Pf lanzenreiches . Einge- 
sciilossen irnter dem Begriff sind die reifen Pflanzen, Saatgat, 
Sprossen und Keimlinge, sowie davon abgeleitete Teile, Vexnneli- 
rungsgut, Pf lanzenorgane, Gewebe, Protoplasten, Kallus und andere 

10 Kulturen, zum Beispiel Zellkulturen, sowie alle anderen Arten von 
Gruppierungen von Pf lanzenzellen zu f unktionellen oder struktu- 
rellen Einheiten. Reife Pflanzen meint Pflanzen zu jedem beliebi- 
gen Entwicklungsstadiaxm jenseits des Keimlings. Keimling meint 
eine junge, unreife Pflanze in einem friihen En twicklungs stadium. 

15 **Pflanze" umfasst alle einjahrigen und mehrjabrige, monokotyledo- 
nen und dikotyledonen Pflanzen und schliel?»t beispielhaft jedoch 
nicht einschrankend solche der Gattungen Cucurbita, Rosa, Vitis, 
Juglans, Fragaria, Lotus, Medicago, Onobrychis, Trifolium, Trigo- 
nella, Vigna, Citrus, Lintjan, Geranium, Manihot, Daucus, Arabidop- 

20 sis, Brassica, Raphanus , Sinapis, Atropa, Capsicum, Datura, Hyo- 
scyamus, Lycopersicon, Nicotiana, Solariiom, Petunia, Digitalis, 
Majorana, Ciah.ori\im, Helianthus, Iiactuca, Bromus, Asparagus, An- 
tirrhinum, Heterocallis , Nemesis, Pelargonium, Panieum, Pennise- 
turn. Ranunculus, Senecio, Salpiglossis , Cucumis, Browaalia, Gly- 

25 cine, Pisum, Pbaseolus, Lolium, Oryza, Zea, Avena, Hordeum, Se- 
cale, Triticum, Sorghum, Picea und Populus ein. 

Bevorzugt sind Pflanzen nachf olgender Pf lanzenf amilien: Amarant- 
haceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae , 
30 Compositae, Cruciferae, Cucurbitaceae , Labiatae, Leguminosae, Pa- 
pilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, Rubia- 
ceae, Saxifragaceae, Scrophulariaceae, Solanacea, Sterculiaceae, 
Tetragoniacea , Theaceae , Umbellif erae . 

35 Bevorzugte monokotyle Pflanzen sind insbesondere ausgewalilt aus 
den monokotylen Kulturpf lanzen, wie zum Beispiel der Familie der 
Gramineae wie Alfalfa, Reis, Mais, Weizen oder andere Getreidear- 
ten wie Gerste, Hirse, Roggen, Triticale oder Hafer sowie dem 
Zuckerrohr sowie alle Arten von Gra^rn. 

40 

Die Erf indimg wird gaxiz besonders bevorzugt aus dikotyledone 
pf lanzliche Organismen angewendet . Bevorzugte dikotyle Pflanzen 
sind insbesondere ausgewahlt aus den dikotylen Kulturpf lanzen, 
wie zum Beispiel 
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- Asteraceae wie Soimenblume, Tagetes oder Calendula und cindere 
mehr , 

- Compositae, besonders die Gattung Lactuca, ganz besonders die ■ 
5 Art sativa (Salat) iind andere mehr, 

- Cruciferae, besonders die Gattoing Brassica, ganz besonders die 
Arten napus (Raps), campestris (Riibe) , oleracea cv Tastie 
(Kohl) , oleracea cv Snowball Y (Blumenkohl) und oleracea cv Em~ 

10 peror (Broccoli) und weitere Kohlarten; und der Gattxing Arabi- 
dopsis, ganz besonders die Art thaliana sowie Kresse oder Ca- 
nola und andere mehr, 

- Cucurbitaceae wie Melone, Kilrbis oder Zucchini und andere mehr, 

15 

- Leguitiinosae besonders die Gattung Glycine, ganz besonders die 
Art max (Sojabohne) Soja sowie Alfalfa, Erbse, Bohnengewachsen 
Oder Erdnuss und andere mehr 

20 - Rubiaceae, bevorzugt der Unterklasse Lamiidae wie beispiels- 
weise Cof fea arabica oder Coffea liberica (Kaf f estrauch) und 
andere mehr, 

- Solanaceae besonders die Gattung Lycopersicon, ganz besonders 
25 die Art esculentiam (Tomate) und die Gattung Solanum, ganz be- 
sonders die Art tuberosum (Kartoffel) und melongena (Aubergine) 
sowie Tabak oder Paprika und andere mehr, 

- Sterculiaceae , bevorzugt der Unterklasse Dilleniidae wie bei- 
30 spielsweise Theobroma cacao (Kakaostrauch) und andere mehr, 

- Theaceae, bevorzugt der Unterklasse Dilleniidae wie beispiels- 
weise Camellia sinensis oder Thea sinensis (Teestrauch) .und an- 
dere mehr, 

35 

- Umbellif erae, besonders die Gattung Daucus (ganz besonders die 
Art carota (Karrotte) ) und Apium (ganz besonders die Art gra- 
veolens dulce (Selarie) ) und andere mehr; und die Gattung Cap- 
sicum, ganz besonders die Art annum (Pfeffer) xind andere mehr, 

40 

sowie Lein, Soya, Baurawolle, Haiif , Flachs, Gurke, Spinat, M5hre, 
Zuckerriibe und den verschiedenen Baum-, Nuss- und Weinarten, ins- 
besondere Banane und Kiwi. 

45 Umfasst sind ferner Schmuckpf lanzen, Nutz- oder Zierbaume, Blu- 
men, Schnittblumen, Straucher oder Rasen. Beispielhaft aber nicht 
einschr&ikend seien zu nennen Angiospermen, Bryophyten wie zirni 
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Beispiel Hepaticae (Lieberbliimchen) und Musci (Moose) ; Pteridophy- 
ten wie Fame, Schachtelhalm und Lycopoden; Gymnosperitieii wie Ko- 
niferen, Cycaden, Ginkgo und Gnetalen, die Familien der Rosaceae 
wie Rose, Ericaceae wie Rhododendrons und Azaleen, Euphorbiaceae 
5 wie Weihnachtssteme und Kroton, Caryophyllaceae wie Nelken, So- 
lanaceae wie Petunien, Gesneriaceae wie das Usambaraveilchen, 
Balsaminaceae wie das Springkraut, Orch.idaceae wie Orchideen, 
Iridaceae wie Gladiolen, Iris, Freesie und ICrokus, Compositae wie 
Ringelblume , Geraniaceae wie Geranien, Liliaceae wie der Drachen- 
10 baum/ Moraceae wie Ficus, Araceae wie Philodendron und andere * 
mehr . 

Pf lanzlicbe Organismen im Sinne der Erfindung sind weiterhin wei- 
tere photosynthetisch aktive befahigte Organismen, wie zvim Bei- 
15 spiel Algen, Cyanobakterien sowie Moose. Bevorzugte Algen sind 
Griinalgen, wie beispielsweise Algen der Gattung Haematococcus , 
Phaedactylmn tricornatuiti, Volvox oder Dunaliella. Insbesondere 
bevorzugt ist Synecbocystis . 

20 Am meisten bevorzugt sind 

a) Pflanzen, die zur Olproduktion geeignet sind, wie beispiels- 
weise Raps, Sonnenblume, Sesam, Farberdistel (Carthamus tinc- 
torius) , 5lbaum, Soja, Mais, ErdnuE, Rizinus, Olpalme, Wei- 
25 zen, Kakaostrauch oder verschiedene Nussarten wie beispiels- 

weise Walnuss, Kokosnufi oder Mandel . Unter diesen wieder be- 
sonders bevorzugt sind dikotyledonen Pflanzen, insbesondere 
Raps, Soja land Sonnenbl\ame . 

30 b) Pflanzen, die der Starkeproduktion dienen, wie beispielsweise 
Mais, Weizen oder Kartoffel. 

c) Pflanzen, die als Nahrungs- und/oder Futtermittel und/ oder 
Nutzpflanze genutzt werden xind bei denen eine Resistenz gg. 

35 Pathogene vorteilhaft ware, wie beispielsweise Gerste, Rog- 

gen, Reis, Kartoffel, Baiamwolle, Flachs, Lein. 

d) Pflanzen, die zur. Produktion von Feinchemikalien wie bei- 
spielsweise Vitaminen und/oder Carotinoiden dienen konnen, 

40 wie beispielsweise Raps. 

Die in den Verfahren verwendeten Organismen werden je nach Wirts- 
organismus in dem Fachmann bekannter Weise angezogen bzw. geztich- 
tet. Mikroorganismen werden in der Regel in einem flussigen Me- 
45 dium, das eine Koblenstof f q[uelle meist in Form von Zuckem, eine 
Stickstof fquelle meist in Form von organischen Stickstof f quellen 
wie Hefeextrakt oder Salzen wie Ammoniinosulf at , Spurenelemente 
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wie Eisen-, Mangan-, Magnesiumsalze und gegebenenf alls Vitamine 
enthait, bei Temperaturen zwischen 0°C und lOO^C, bevorzugt zwi- 
schen 10°C bis GO^'C iinter Sauerstof fbegasung angezogen. Dabei kann 
der pH der Nalirf itissigkeit auf einen fasten Wert gehalten werden, 
5 das heist wabrend der Anzucht reguliert werden oder nicht. Die 
Anzucht kann batch weise, semi batch weise oder kontinuierlich 
erfolgen. Nahrstoffe kdxmen zu beginn der Fermentation vorgelegt 
Oder semikontinuierlich oder kontinuierlich nach geftittert wer- 
den - 



10 



Nachf olgende Anwendung des erf indungsgemaSen Verf ahrens seien 
beispielhaft jedoch nicht einschrankend zu nennen: 

I . pf lanzenbiotechnologie 



15 



Bevorzugt wird das er.f indungsgemafie Verfahreri im Rahmen der 
Pflanzenbiotechnologie zur Erzeugung von Pflanzen mit vorteilhaf- 
ten Eigenschaften eingesetzt. So kann Eignung der Pflanzen oder 
deren Samen als Nahrungs- oder Futtermittel verbessert werden, 
20 beispielsweise iiber eine Veranderung der Zusammensetzimgen und/ 
Oder des Gehalt an Metaboliten, insbesondere Proteinen, Olen, Vi- 
taminen und/oder Starke. Auch konnen Wachstvmsrate, Ertrag oder 
die Resistenz gegen biotische oder abiotische Stressf aktoren er- 
hoht werden. Nachf olgende Anwendxingen im Bereich der Pflanzenbio- 
25 technologie sind insbesondere vorteilhaft. Die angegebenen mogli- 
chen Zielgene sind beispielhaft jedoch nicht einschrankend zu 
verstehen: 

1. Verbesserter Schutz gegen abiotische Stressf aktoren (Hitze, 
30 Kalte, Trockenheit, erhohte Feuchtigkeit , Umweltgifte, UV- 

Strahlung) . Bevorzugt werden Gene in iherer Expression ver- 
mindert, die am Stressreaktionen beteiligt sind. 

2. Modifikation der Zusammensetzung und/oder des Gehaltes an 
35 Fettsauren, Lipiden oder Olen 

Eine Veranderung des Fetts^uregehal ten oder der Fettsaurezu- 
sammensetzung, vorzugsweise in einer Olfrucht wie Raps oder 
Sonnenblume, kann beispielsweise erreicht werden durch Ver- 

40 minderung der Genexpression von Genen der Fettsaurebiosynt- 

hese vorzugsweise ausgewahlt aus der Gruppe bestehend aus Ge- 
nen kodierend fiir Acetyl transacylasen, Acyltransportprot einen 
("acyl carrier protein"), Desaturasen wie Stearyldesaturasen 
Oder milcrosomale A12-Desaturasen insbesondere Fad2-1 Gene, 

45 Malonyltransacylase, p-Ketoacyl-ACP-synthetasen, B-Keto-ACP- 

reduktasen, Enoyl-ACP-hydrasen, Thioesterasen wie Acyl-ACP- 
thioesterases , Enoyl-ACP-reduktasen. Verschiedene weitere vor- 
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teilhafte Ansatze z\ir Modif izierung der LipidzusaEnmensetzttng 
sind besclirieben (Shure M et al . (1983) Cell 35:225-233; 
Preiss et al. (1987) Tailoring Genes for Crop Improvement 
(Bruening et al., eds . ) , Plenxun Press, S. 133-152; Gupta et 
5 al. (1988) Plant Mol Biol. 10:215-224; Olive et al . (1989) 

Plant Mol Biol 12:525-538; Bhattacharyya et al . (1990) Cell 
60:155-122; Dunwell JM (2000) J Exp Botany 51Spec No: 487-96; 
Brar DS et al . (1996) Biotech Genet Eng Rev 13:167-79; Kis- 
h.ore GM und Somerville CR (1993) Curr Opin Biotech 

10 4(2): 152-8). Bevorzugt sind insbesondere Fad2 Gene (z.B. be- 

schrieben durch Genbank Ace. -Nr.: AF124360 {Brassica cari- 
na t a.) , AF042841 (Brasslca rapa) , L26296 (Arabldopsis tha- 
liana), A65102 (Corylus avellana) ) . Weitere vorteilhafte Gene 
und Verfahren zur Modif ikation des Lipidgehaltes sind bei-. 

15 spielsweise beschrieben in US 5,530,192 und WO 94/18337. Ein 

erhohter Lipidgehalt kann auch erreicht werden durch Vermin- 
derung des Starkegehalte bespielsweise infolge verminderter 
Expression von von Enzymen des Kohlenhydratstof fwechsels 
(z.B. ADP-Glucosepyrophosphorylasen ) . 



20 



Modifikation der Kohlenhydratzusairanensetzung 



Eine Modifikation der Kohlehydratzusammensetzung kann bei- 
spielsweise erreicht werden durch Vermindeirung der Genexpres- 

25 sion von Genen des Kohlenhydratstof fwechsels oder der Kohlen- 

hydratbiosynthese, beispielsweise der Biosynthese von Amy- 
lose, Pektinen, Cellulose oder Zellwandkohlenhydraten . Da- 
durch kann eine Vielzahl zellularer Prozesse (Reifung, Halfe- 
stigkeit, Starkezusammensetzung oder -gehalt etc.) in vor- 

30 teilhafter Weise beeinflusst werden. Als Zielgene seien bei- 

spielhaft jedoch nicht einschrankend zu nennen Phosphoryla- 
sen, Starkesynthetasen, Q-Enzyme , Sucrose-6-phosphatsyntheta- 
sen, Sucrose-6-phosphatphosphatasen, ADP-Glucosepyrophospho- 
rylasen, Branching-Enzyme, Debranching-Enzyme sowie diverse 

35 Amylasen. Die entsprechenden Gene sind beschrieben (Dunwell 

JM (2000) J Exp Botany SlSpec No: 487-96; Brar DS et al . 
(1996) Biotech Genet Eng Rev 13:167-79; Kishore GM xind Somer- 
ville CR (1993) Curr Opin Biotech 4(2):152-8). Vorteilhafte 
Gene zur beeinf lussung des Kohlenhydratstof fwechsels - insbe- 

40 sondere der Starkebiosynthese - sind beschrieben in WO 

92/11375, WO 92/11376, US 5, 365,016 \md WO 95/07355. 

4 . Veranderung der Farbe oder Pigmentierung 



45 



Veranderung der Farbe oder Pigmentierung vorzugsweise von 
Zierpflanzen kann beispielsweise erreicht werden durch Ver- 
minderung der Genexpression von Genen der Flavonoid-Biosynt- 
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hese wie beispielsweise Chalconsynthasen, Chalconisomerasen, 
Phenylalaninainmonialyasen , Dehydrokaempf erol ( f lavone ) hydroxy- 
lasen wie Flavanon-3-hydroxylasen oder Flavanon-2-h.ydjroxyla- 
sen, Dihydrof lavonolreduktasen, Dihydrof lavanol-2-hydroxyla- 
5 sen , Flavonoid-3 ' -hydroxylasen , Flavonoid-5 ' -hydr oxylasen , 

Flavonoidglycosyltransf erasen (z.B. Glucosyltransf erasen wie 
UDPG : Flavonoid- 3-0-glucosyltransf erasen, UDPG : Flavo- 
nol-7-0~glucosytransf erasen oder Rhainnosyltransf erasen) , Fla- 
vonoidmethyltransf erasen (wie z.B. SAMrAnthocyani- 

10 din-3- (p-covimaroyl ) -rutinosid-5-glucosid-3 ' , 5 ' -0-methyltrans- 

f erasen) und Flavonoidacyltransf erasen (Hahlbrock (1981) Bio- 
. chemistry of Plants, Vol.7, Conn (Ed.); Weiring and de Via- 
ming (1984) ^'Petunia", KG Sink (Ed.), Springer-Verlag, New 
York) • Geeignet sind insbesondere die in EP-Al 522 880 be- 

15 scliriebenen Seguenzen. 

5 . Verminderung des Gehaltes von Speicherproteinen 

Die Verminderung der Genexpression von Genen kodierend fiiir 
20 Speicherproteine (infolge SP) hat zahlreiche Vorteile, wie 

beispielsweise Verminderung des allergenen Potentials oder 
Veranderxmg in der Zusammensetzung oder Menge anderer Metabo- 
lite. Speicherproteine sind u.a beschrieben in EP-A 0 591 
530, WO 8.7/47731, WO 98/26064, EP-A 0 620 281; Kohno-Murase J 
25 et al. (1994) Plant Mol Biol 26(4): 1115-1124. 

SP dienen zur Speicherung von Kohlenstoff , Stickstoff und 
Schwefel, die ftir das schnelle heterotrophe Wachstum bei Kei- 
mung von Samen oder Pollen benotigt werden. Sie haben meist 
30 keine enzymatische Aktivitat. SP werden dabei nur im Embryo 

wahrend der Samenentwicklimg synthetisiert \md akkumulieren 
dabei zum einen in Proteinspeichervakuolen (PSV) von unter— 
schiedlich dif f erentzierten Zellen im Embryo bzw. Endosperm. 

35 ^"Speicherprotein" meint allgemein ein Protein, das mindestens 

eine der nachf olgenden wesentlichen Eigenschaf ten aufweist: 

i) Speicherproteine werden im wesentlichen nur im Embryo 
wahrend der Samenentwickliing exprimiert. ''Im wesentli- 
40 chen" bedeutet dabei, dass in dem besagten Stadiiam minde- 

stens 50%, bevorzugt mindestens 70%, ganz besonders be- 
vorzugt mindestens 90%, am meisten bevorzugt mindestens 
95% der Gesamtexpression liber die Lebensdauer einer 
Pflanze hinweg stattfindet. 

45 
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ii) Speicherproteine warden wahrend der Keimung des Samen 
wieder abgebaut . Dabei betragt der Abbau wahrend der Kei- 
iming mindestens 20%, bevorzugt mindestens 50%, ganz be- 
sonders bevorzugt mindestens 80%. 

5 

iii) Speicherproteine inachen einen wesentlichen Anteil am Ge- 
samtproteingehalt des nicht-keimenden Samens aus. Bevor- 
zugt macht das Speicherprotein in dem nicht-keimenden Sa- 
men der Wildtyp-Pf lanze mehr als 5 6ew.% des Gesamtpro- 

10 teins aus, besonders bevorzugt mindestens 10 Gew.%, gamz 

besonders bevorzugt mindestens 20 Gew.%, sm meisten be- 
vorzugt mindestens 30 Gew.-%. 

Bevorzugt weisen Speicherproteine 2 oder alle der oben ge- 
15 nannten wesentlichen Eigenschaf ten i) , ii) oder iii) auf. 

Speicherproteine k5nnen in Untergruppeh entsprechend weiterer 
charakteristischer Eigenschaf ten, wie beispielsweise ihrem 
Sedimentationskoef f izienten oder der Loslichkeit in verschie- 
20 denen Losungen (Wasser, Salzlosung, Alkohol) aufgeteilt wer- 

den. Die Bestimmung des Sedimentationskoef f izienten kann in 
der dem Fachmann vertrauten Weise mittels Ultrazentrifugation 
duxchgeftihrt werden (z.B. beschrieben bei Correia JJ (2000) 
Methods in Enzymology 321:81-100). 



25 



30 



Insgesamt konnen vier grosse Genfamilien fiir Speicherproteine 
aufgrund ihrer Sequenzen zugeordnet werden: 2S-Albumine (Na- 
pin-ahnlich) , 7S-Globuline (Phaseolin-ahnlich) , llS/12S~Glo- 
buline (Legumin-ZCrucif erin-ahnlich) und die Zein- Prolamine . 



2S Albumine sind weit verbreitet in Samen von Dikotyledonen, 
einschliesslich wichtiger kommerzieller Pf lanzenf amilien wie 
Fabaceae (z.B. Sojabohne) , Brassicaceae (z.B. Raps), Euphor- 
biaceae (z.B. Rizinus) oder Asteraceae (z.B. Sonnenblime) . 2S 
35 Albumine sind kompakte globulare Proteine mit konservierten 

Cysteinresten, die oft Heterodimere bilden. 

7S-Globuline liegen in trimerer Form vor und enthalten keine 
Cysteinreste . Nach ihrer Synthese werden sie wie die 2S-Albu- 

40 mine in kleinere Fragmente gespalten xmd glykosyliert . Trotz 

Unterschiede in der Polypeptidgrosse sind die verschiedenen 
7S-Globuline hoch konserviert und gehen vermutlich wie die 
2S-Albumine auf einen gemeinsames Vorlauf erprotein zuruck. 
Die 7S-Globuline sind nur in geringen Mengen in Monokotyledo- 

45 nen vorhanden. In Dikotyledonen ist ihr Anteil immer kleiner 

verglichen mit den llS/12S-Globulinen. 
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llS/12S-Globuline stellen neben den 2S-AlbuDainen die Haupt- 
fraktion der Speicherproteine in Dikotyledonen. Die hohe Ahn- 
lichkeit der verscliiedenen llS-Globuline axis verschiedenen 
Pflanzengattungen lassen wiederriam auf einen gercieinsaities Vor- 
5 lauf erprotein in der Evolution schliessen. 

Bevorzugt ist das Speicherprotein ausgewahlt aus den Klassen 
der 2S-Albuinine (Napin-ahnlich) , 7S~Globuline (Phaseolin-ahn- 
lich) , llS/12S-Globuline (Legumin-ZCrucif erin-ahnlich) oder 
10 Zein- Prolamine . 

Besonders bevorzugt e 2S-Albuinine umfassen 



i) 2S-Albiunine aus Arabidopsis, ganz besonders bevorzugt die 
15 2S-Alb\amine mit der SEQ ID NO: 2, 4, 6 oder 8, am meisten 

bevorzugt die durcb die NukleinsSuren gemaS SEQ ID NO: 1, 
3, 5 Oder 7 kodierten Proteine, 

ii) 2S-Albumine aus Arten der Gattung Brassica, wie bei- 

20 spielsweise Brassica napus, Brassica nigra, Brassica jun- 

cea, Brassica oleracea oder Sinapis alba, ganz besonders 
bevorzugt die 2S-Albumine mit der SEQ ID NO: 32, 34, 36, 
38, 40, 46 Oder 48, am meisten bevorzugt die durch die 
Nukleinsauren gemafi SEQ ID NO: 31, 33, 35, 37, 39, 45 

25 Oder 47 kodierten Proteine, 



iii) 2S-Albumine aus Soja, ganz besonders bevorzugt die 2S~Al- 
bucnine mit der SEQ ID NO: 42 oder 44, am meisten bevor- 
zugt die durch die Nukleinsauren gemaS SEQ ID NO: 41 oder 

30 43 kodierten Proteine, 

iv) 2S-Albumine aus Sonnenblvime (Helieinthus annus) , ganz be- 
sonders bevorzugt die 2S-Albumine mit der SEQ ID NO: 50 
oder 52, am meisten bevorzugt die durch die Niikleinsauren 

35 gemafi SEQ ID NO: 49 oder 51 kodierten Proteine, 

sowie die entsprechenden Homologen \ind funktionellen Aquiva- 
lente zu i) oder ii) oder iii) oder iv) aus identischen oder 
anderen Pf lanzfenarten, insbesondere Raps, Sonnenblume, Lein, 
40 Sesam, Farberdistel, Olbaijm, Soja oder verschiedene Nussar- 

ten. Fxmktionelle Aquivalente zeichnen sich bevorzugt neben 
den oben genannten wesentlichen Eigenschaf ten durch charakte- 
ristische Eigenschaf ten wie einen 2S-Sedimentationskoef f i- 
zienten und/oder durch eine Loslichkeit in Wasser aus. 

45 



BNSDOCID: <WO ^03078e29A1 J_> 



wo 03/078629 



PCT/EP03/02735 



31 

Funktionelle iiquivalente der 2S-Albinnine haben in einer wei- 
teren bevorzugten Ausf iihrimgsf orm eine Hoiholog-ie von minde- 
stens 60%, bevorzugt mindestens 80%, ganz besonders bevorzugt 
mindestens 90%, am meisten bevorzugt mindestens 95% zu einer 
5 der Proteinsequenzen mit der SEQ ID NO: 2, 4, 6, 8, 32, 34, 

36, 38, 40, 42, 44, 46, 48, 50 oder 52 wobei die Homologie 
sich bevorzugt iiber eine Lange von mindestens 30 Aminosauren, 
bevorzugt mindestens 50 Aminosauren besonders bevorzugt iiber 
100 Aminosauren, am meisten bevorzugt iiber die gesamte Lange 
10 der jeweiligen Proteine erstreckt, und weisen die gleichen 

wesentlichen Eigenschaf ten eines Speicherproteins und - be- 
vorzugt- die charakteristischen Eigenschaf ten eines 2S— Spei- 
cherproteins auf . 

15 Besonders bevorzugte 7S-Globuline umfassen solche aus Arabi- 

dopsis Oder Soja, ganz besonders bevorzugt die Proteine mit 
der SEQ ID NO: 94 oder 96, am meisten bevorzugt die durch die 
Nukleinsauren gemaS SEQ ID NO: 93 oder 95 kodierten Proteine. 
Funktionelle Aquivalente zeichnen sich bevorzugt neben den 

20 oben genannten wesentlichen Eigenschaf ten durch charakteri- 

stische Eigenschaf ten wie einen TS-Sedimentationskoef f izien- 
ten und/oder durch eine Loslichkeit in Salzlos\ing aus. Als 
weitere' charakteristische Eigenschaf t k5nnen 7S-Globuline 
keine Cysteinreste enthalten. 

25 

Fimktionelle Aquivalente der 7S-Globuline haben in einer wel- 
ter en bevorzugt en Ausf lihrungs form eine Homologie von minde- 
stens 60%, bevorzugt mindestens 80%, ganz besonders bevorzugt 
mindestens 90%, am meisten bevorzugt mindestens 95% zu einer 

30 der Proteinsequenzen mit der SEQ ID NO: 94 oder 96 wobei die 

Homologie sich bevorzugt iiber eine Lange von mindestens 30 
Aminosauren, bevorzugt mindestens 50 Aminosauren besonders 
bevorzugt iiber 100 Aminosauren, am meisten bevorzugt iiber die 
gesamte Lange der jeweiligen Proteine erstreckt, und weisen 

35 die gleichen wesentlichen Eigenschaf ten eines Speicherpro- 

teins und - bevorzugt- die charakteristischen Eigenschaf ten 
eines 7S-Speicherproteins auf. 

Besonders bevorzugte llS/12S-Globuline umfassen bevorzugt 
40 llS-Globuline aus Raps, Soja und Arabidopsis insbesondere 

i) llS-Globuline aus Raps mit der SEQ ID NO: 10, 12, 14. 16 
oder 18, am meisten bevorzugt die durch die Nukleinsauren 
gema£ SEQ ID NO: 9, 11, 13 , 15 oder 17 kodierten Pro- 
45 teine. 
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ii) die llS-Globuline aus Soja mit der SEQ ID NO: 20, 22, 24, 
26 Oder 28, am meisten bevorzugt die diirch die Nuklein- 
sauren gemafi SEQ ID NO: 19, 21, 23, 25 oder 27 kodierten 
Proteine , 

5 

iii) die llS-Globuline aus Arabidopsis thaliana mit der SEQ ID 
NO: 60, 62, 64, 66, 68 oder 70 am meisten bevorzugt die 
durch die Niikleinsauren gema£ SEQ ID NO: 59, 61, 63, 65, 
67 Oder 69 kodierten Proteine, 

10 

sowie die enfcsprechenden Homologen \ind funktionellen Aquiva- 
lente aus anderen Pf lanzenarten, insbesondere Raps, Sonnen- 
blxime, Lein, Sesam, Farberdistel , Olbaum, Soja oder verscbie- 
dene Nussarten, wie beispielsweise das Sonnenblime IIS Spei- 

15 cherprotein (SEQ ID NO: 30), insbesondere das durch die Nu- 

kleinsauresequenz gema£ SEQ ID NO: 29 kodierte Protein. Funk- 
tionelle Aquivalente zeichnen sich bevorzugt neben den oben 
genaimten wesentlicben Eigenschaf ten durch charakteristische 
Eigenschaften wie einen IIS- oder 12S-Sediinentationskoef f i- 

20 zienten und/oder durch eine Ldslichkeit in Salzlosung (PBS; 

phosphatgepuf f erte Salzlosung) und/oder eine schlechte L5s- 
lichkeit in Wasser aus. 

Funktionelle Aquivalente der IIS- oder 12S Albumine haben in 
25 einer weiteren bevorzugten Aus ftihrungs form eine Homologie von 

mindestens 60%, bevorzugt mindestens 80%, ganz besonders be- 
vorzugt mindestens 90%, am meisten bevorzugt mindestens 95% 
zu einer der Proteinsequenzen mit der SEQ ID NO: 10, 12, 14, 
16, 18, 20, 22, 24, 26, 28, 30, 60, 62, 64, 66, 68 oder 70 
30 wobei die Homologie sich bevorzugt uber eine Lange von minde- 

stens 30 Aminosauren, bevorzugt mindestens 50 Aminosauren be- 
sonders bevorzugt tiber 100 Aminosauren, am meisten bevorzugt 
tiber die gesamte LSnge der jeweiligen Proteine erstreckt, und 
weisen die gleichen wesentlichen Eigenschaften eines Spei- 
35 cherproteins und - bevorzugt- die charakteristischen Eigen- 

schaften eines IIS- oder 12S-Speicherproteins auf. 



Besonders bevorzugte Zein-Prolamine umfassen bevorzugt solche 
aus monokotyledonen Pflanzen, insbesondere Mais, Rais, Hafer, 

40 Gerste oder Weizen. Ganz besonders bevorzugt sind die Mais 

Zein-Prolamine beschrieben durch SEQ ID NO: 98, 100, 102 oder 
104 - insbesondere die durch SEQ ID NO 97, 99, 101 oder 103 
kodierten Protein das Reis Prolamin gemaS SEQ ID NO: 106 - 
insbesondere das durch SEQ ID NO 105 kodierte Protein -, das 

45 Hafer Prolamin gemaS SEQ ID NO: 108 - insbesondere das durch 

SEQ ID NO 107 kodierte Proteine-, das Gerste Prolamin gemaS 
SEQ ID NO: 110 und/oder 111 - insbesondere das durch SEQ ID 
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NO 109 kodierte Protein - und das das Weizen Prolamin ^ema& 
SEQ ID NO: 113 - insbesondere das durch SEQ ID NO 112 ko- • 
dierte Protein. Funktionelle Aquivalente zeichnen sich bevor- 
zugt durch eine Loslichkeit in 70%iger ethanolischer Losxing 
5 und eine schlechte Loslichkeit in Wasser oder Salzlosung aus . 

Funktionelle Aquivalente der Zein-Prolamine haben in einer 
weiteren bevorzugten Aus fxihrungs form eine Homologie von min~ 
destens 60%, bevorzugt mindestens 80%, ganz besonders bevor- 
10 zugt mindestens 90%, am meisteri bevorzugt mindestens 95% zu 

einer der Proteinsequenzen mit der SEQ ID NO: 98, 100, 102, 
104, 106, 108, 110, 111 Oder 113 wobei die Homologie sich be- 
vorzugt liber eine Lange von mindestens 3 0 Aminosauren, bevor- 
zugt mindestens 50 Aminosauren besonders bevorzugt iiber 100 
- 15 Aminosauren, am meisten bevorzugt tiber die gesamte Lange der 

jeweiligen Proteine erstreckt, und weisen die' gleichen -we- 
sentlichen Eigenschaf ten eines Speicherproteins und - bevor- 
zugt- die charakteristischen Eigenschaf ten eines Zein— Prola- 
mine auf . 

20 

Funktionelle Aquivalente meint insbesondere naturliche oder 
kiinstliche Mutationen der obengenannten Speicherproteine so- 
wie homologe Polypeptide aus anderen Pflanzen, die die glei- 
chen wesentlichen und - bevorzugt - charakteristischen Eigen- 

25 . schaften auf weisen. Bevorzugt sind homologe Polypeptide aus 

oben beschriebenen bevorzugten Pflanzen. Die zu den im Rahmen 
dieser Erfindung of fenbarten Speicherproteinen homologen Se- 
quenzen aus anderen Pflanzen - beispielsweise solchen deren 
genomische Sequenz ganz oder teilweise bekannt ist, wie bei- 

30 • spiel sweise aus Arabidopsis thaliana, Brassica napus, Nico- 

tiana tabacum oder Solanum tuberosum - durch Homologiever- 
gleiche aus Datenbanken auffinden. konnen z.B. durch Daten-.. 
banksuche oder Durchmustern von Gen-Banken - unter Verwendung 
der beispielhaft aufgefiihrten Speicherprotein-Sequenzen als 

35 Suchsequenz bzw. Sonde - leicht aufgefunden werden. 

Mutationen umfassen Subs ti tut ionen, Additionen, Deletionen, 
Inversion oder Insertionen eines oder mehrerer AminosSurere- 
ste . 

40 

Ein weiterer Gegenstand der Erfindung umf asst ein z\amindest 
teilweise doppelstrangiges Ribonukleinsauremolekul , wobei das 
doppelstrSngige Ribonukleinsauremolekiil umfasst 

45 i) einen sense "-RNA-Strang umfassend mindestens zwei Ribo- 

nukleotidsequenzabschnitte, wobei jeweils mindestens ei- 
ner dieser Ribonukleotidsequenzabschnitte im wesentlichen 
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identisch ist zu mindestens einem Teil des « sense" -RNA- 
Transkriptes einer Speicherprotein-Nukleinsauresequenz 
gemafi SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15 , 17, 19, 21, 
23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 
5 51, 59, 61, 63, 65, 67, 69, 71, 93, 95, 97, 99, 101, 103, 

105, 107, 109 Oder 112 oder eines fvmktionellen Aquiva- 
lentes derselben, wobei jedoch nicht alle Ribonukleotid- 
sequenzabschnitte zu dem « sense "-RNA-Transkript eines 
einzigen einer Speicherprotein-Nukleinsaxiresequenz iden- 
10 tisch sind, und 

ii) einen *^antisense"-R]SIA-Strang, der zu dem RNA-sense-Strang 
iinter i) im wesentlichen komplementaren ist. 

15 Bevorzugt haben zumindest zwei der Speicherprotein-Nuklein- 

sauresequenzen, zu deren - sense "-RNA-Transkript die besagten 
Ribonukleotidsequenzabschnitte im wesentlichen ideritiscb " 
sind, vintereinander eine Homologie von unter 90%, bevorzugt 
unter 80%, ganz besonders bevorzugt unter 60% am meisten be- 

20 vorzugt unter 50% uber die gesamte Lange ihrer kodierenden 

Nukleotidsequenz . 

In einer weiteren bevorzugten Ausfiihrungsf orm entbalt die 
dsRNA mebrere Sequenzabschnitte, die eine gleichzeitige Sup- 
25 pression mehrerer Speicherproteine, bevorzugt von Speicher- 

proteinen aus verscbiedenen Klassen - wie beispielsweise ei- 
nem 2S-AlbiHain, 7S-Globuline, llS/12S-Globulin oder die Zein- 
Prol amine - bewirken. 

30 Am meisten bevorzugt sind doppelstrangige RNA Molekule be- 

schrieben durch die Ribonukleinsauresequenz gemaJl SEQ ID NO: 
84, 86 Oder 88. Diese werden bevorzugt kodiert durch Nukleo- 
tidsequenzen entsprechend SEQ ID NO: 83, 85 oder 87. 

35 5. Erreichen einer Resistenz gegen pflanzliche Pathogene 

' Eine Resistenz gegen pflanzlicbe Patbogene wie Arachniden, 
Pilze, Insekten, Nematoden, Protozoen, Viren, Bakterien und 
Krankbeiten kann erreicht werden durch Verminderung der Ge- 

40 nexpression von Genen, die ftir das Wachstum, Uberleben, be- 

stimmte Entwicklungsstuf en (beispielsweise Verpupp\ang) oder 
die Vermehrung eine bestimmten Pathogens essentiell sind. 
Eine entsprechende Verminderung kann eine vollstandige Inhi- 
bition vorgenannter Schritte aber auch eine Verz6gerung der- 

45 selben bewirken. Dies konnen pflanzliche Gene sein, die dem 

Pathogen beispielsweise das Eindringen ermdglichen, konnen 
aber auch pathogen- eigene Gene sein. Bevorzugt ist die dsRNA 
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gg. Gene des Pathogens gerichtet. Als anti-Pathogenes Agens 
kann dabei die dsRNA selber, jedoch auch die Expr ess ions sy- 
steme, Expressionskassetten oder transgenen Organismen wir- 
ken. Pflanzen k5nnen beispielsweise mit. geeigneten Formulie- 
5 ningen vorgenannter Agentien behandelt, beispielsweise be- 

sprtiht Oder estaiabt werden Die Pflanzen selber konnen jedoch. 
in Form eines transgenen Organismus die Agentien beinhalten 
nnd diese - beispielsweise in Form eines FraSgiftes - an die 
Pathogene weitergeben. Verschiedene essentielle Gene diverser 
10 Pathogene sind dem Fachmann bekannt (z.B. fur Nematodenresi- 

stenz WO 93/10251, WO 94/17194). 

Am meisten bevorzugt als Pathogen sind Pilzpathogene wie Phy- 
tophthora infestans, Fusarium nivale, Fusarium graminearum, 

15 Fusarium culmorum, Fusarium oxysporum, Blximeria graminis, 

Magnaporthe grisea, Sclerotinia sclerotiiam, Septoria nodorum, 
Septoria tritici, Alternaria brassicae, Phoma lingam, bakte- 
^rielle Pathogene wie Corynebacterixam sepedonicum, Erwinia ca- 
rotovora, Erwinia amylovora, Streptomyces scabies, Pseudomo- 

20 nas syringae pv. tabaci, Pseudomonas syringae pv. phaseoli- 

cola, Pseudomonas syringae pv. tomato, Xanthomonas campestris 
pv. malvacearum und Xanthomonas campestris pv. oryzae, imd 
Nematoden wie Globodera rostochiensis, G. pallida, Hetero- 
dera schachtii, Heterodera avdnae, Ditylenchus dipsaci, An- 

25 guina tritici und Meloidogyne hapla. 

Eine Virusresistenz kann beispielsweise durch Verminderung 
der Expression eines viralen Hullproteins , einer viralen Re- 
plikase, einer viralen Protease etc. erreicht werden. Zahl- 
30 reiche Pf lanzenviren void entsprechende Zielgene sind dem 

Fachmann bekannt . 

6. Verhinderxing von Halmbruch 

35 Eine verminderte Anfalligkeit gegen Halmbruch kann beispiels- 

weise erreicht werden durch Verminderung der Genexpression 
von Genen des Kohlenhydratstof fwechsels (s.o.). Vorteilhafte 
Gene sind beschrieben (u.a. WO 97/13865) und umfassen geweb- 
spezifische Polygalacturonasen oder Cellulasen. 



40 



Verzagerung der Fruchtreifung 



Eine verzogerte Fruchtreifung kann beispielsweise erreicht 
werden durch Verminderung der Genexpression von Genen ausge- 
45 wahlt aus der Gruppe bestehend aus Polygalacturonasen, Pecti- 

nesterasen, p- { 1-4 ) glucanasen (Cellulasen) , P-Galac tanas en ( 
P-Galactosidasen) , oder Gene der Ethylenbiosynthese wie 
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l-Aoiinocyclopropan-l-caxboxylatsynthase, Gene der Carotinoid- 
biosynthese wie z.B. Gene derPrephytoen- oder Phytoenbiosynt- 
hese beispielsweise Phytoendesaturasen. Weitere vorteilhafte 
Gene sind bespielsweise in WO 91/16440, WO 91/05865, WO 
5 91/16426, WO 92/17596, WO 93/07275 oder WO 92/04456. 



8- Erzielen einer mannlichen SterilitSt ("male sterility"). Ent- 
sprechende Zielgene sind beschrieben u.a. in WO 94/29465, 
WO89/10396, WO 92/18625. 

10 

9 . Verminderung imerwtinschter oder toxischer Pf lanzeninhalts- 
stoffe wie z.B. Glucosinolaten. Entsprechende Zielgene sind 
beschrieben (u.a. in WO 97/16559) . 

15 10. Verzogerung von Alterserscheinungen. Entsprechende Zielgene 
sind u.a. Cinnamoyl-CoAiNADPH-Reduktasen oder Cinnamoylalko- 
holdehydrogenasen. Weitere Zielgene sind beschrieben (u.a. in 
WO 95/07993) . • 

20 11. Modifikation der Lignif ikation und/oder des Ligningehaltes 

vor allem in Baumarten. Entsprechende Zielgene sind beschrie- 
ben u.a. in WO 93/05159, WO 93/05160. 

12. Modifikation des Faseranteils in Nahrungsmitteln vorzugsweise 
25 in Samen durch Verminderung der Expression der Cof f einsaure- 

0-methyl transferase oder der Cixmamoylalkoholdehydrogenase. 

13. Modifaktion der Faserqualitat in Baioiowolle. Entsprechende 
Zielgene sind beschrieben u.a. in US 5,597,718. 

30 

14 . Verminderung der StoSanf alligkeit von beispielsweise Kartof - 
feln durch Verminderung beispielsweise der;. Polyphenoloxidase 
(WO 94/03607) etc. 

35 15 - Steiger\ing der Vitamin E Biosynthese beispielsweise durch 

Verminderung der Expression von Genen aus dem Homogentisatab- 
bauweg wie z.B. der Homogentisat-1 , 2— dioxygenase (HGD; 
EC-Nr . : 1 . 13 - 11 . 5 ) , der Maleylacetoacetatisomerase (MAAI ,- 
EC-Nr . : 5.2.1.2.) oder der Fumarylacetoacetathydrolase (FAAH; 

40 EC-Nr. : 3.7.1.2) . 



Bin weiterer Gegenstand der Erf indung umfasst ein zumindest 
teilweise doppelstrangiges Ribonukleinsaviremolekul, wobei das 
doppelstrangige Ribonukleinsauremolekiil umfasst 



45 
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i) einen sense ''-RNA-St rang umfassend mindestens zwei Ribo- 
nukleotidsequenzabschnitte, wobei jeweils mindestens ei- 
ner dieser Ribonukleotidseguenzabschnitte im wesentlichen 
identisch ist zu mindestens einem Teil des sense "-RNA- 

5 Transkriptes eines Gens aus dem Homogentisatabbauweg ge- 

maS SEQ ID NO: 115, 116, 118 oder 120 oder eines funktio- 
nellen Aquivalentes derselben, wobei jedoch nicht alle 
Ribonukleotidsequenzabschnitte zu dem sense "-RNA-Trans- 
kript eines einzigen einer Speicherpirotein-Nukleinsaure- 
10 sequenz identisch sind, und 

ii) einen "^antisense^'-RMA-Strang, der zu dem RNA-sense-Strang 
unter i) im wesentlichen komplementaren ist. 

15 16. Verminderung des Nikotingehaltes beispielsweise in Tabak 

durch veinninderte Expression beispielsweise der N~Methyl-pu- 
trescinoxidase und der Putrescin-N-methyl transferase. 

17. Venainderxing des Cof f eingehaltes in der Kaffeebohne (Coffea 
20 arabica) durch durch Verminderung der Genexpression von Genen 

der Cof f einbiosynthese wie 7-Methylxanthine-3 -methyl transfe- 
rase . 

18. Verminderiing des Theophyllin-Gehaltes im Tee (Camellia sinen- 
25 sis) durch durch Verminderxing der Genexpression von Genen der 

Theophyllin-Biosyn these wie beispielsweise 1-Methylxant- 
hin~3-methyl transferase . 

19 . Erhohung des Methioningehaltes durch Verminderung der Threo- 
30 ninbiosynthese, beispielsweise durch Verminderung derExpres- 

sion der Threoninsynthase (Zeh M et al . (2001) Plant Physiol 
127 (3) :792-802) . 

Weitere Beispiele ftir vorteilhafte Gene sind zum Beispiel genannt 
bei Dunwell JM, Transgenic approaches to crop improvement, J Exp 
Bot. 2000; 51 Spec No; Seite 487-96. 

Jede der oben genannten Anwendungen kcum als solche isoliert an- 
gewendet werden. Nattirlich konnen auch mehr als eine der oben ge- 
nannten AnsStze gleichzeitig angewendet werden. Dabei wird bei 
alien Anwendungen die Expression von mindestens zwei unterschied- 
lichen Zielgenen, wie oben definiert, vermindert . Diese Zielgene 
konnen dabei aus einer einzigen ftir eine Anwendung bevorzugten 
Gruppe von Genen stammen oder aber auch unter schiedlichen Anwen- . 
dungsgruppen zugeordnet sein. 



40 
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Zur Anwendung der erf indungsgema&en Verf ahren stehen dem Fachiaaim 
gelaufige Werkzeuge, wie Esqpressionsvektoren mit fiir Pflanzen ge- 
eigneten Promotoren, sowie Verf ahren zur Transformation und Rege- 
neration von Pflanzen zur Verfugung. Pf lanzenspezif ische 
Promotoren meint grundsatzlich jeden Promotor, der die Expression 
von Genen, insbesondere Fremdgenen, in Pflanzen oder Pflanzentei- 
len, -zellen, -geweben, -kulturen steuem kann. Dabei kann die 
Expression beispielsweise konstitutiv, induzierbar oder entwick- 
lungsabhSngig sein. Bevorzugt sind: 

a) Konstitutive Promotoren 



"Konstitutive" Promotoren meint solche Promotoren, die eine Ex- 
pression in zahlreichen, bevorzugt alien, Geweben tiber einen 

15 groEeren Zeitraum der Pf lanzenentwicklung, bevorzugt zu alien 
Zeitpunkten der Pf lanzenentwicklung, gewahrleisten (Benfey et 
al.(1989) EMBO J 8:2195-2202). Vorzugsweise verwendet man ins- 
besondere einen pflanzlichen Promoter oder einen Promoter, der 
einem Pf lanzenvirus entstaramt, Insbesondere bevorzugt ist der 

20 Promoter des 35S-Transkriptes des CaMV Blumenkohlmosai3cvirus 

(Franck et al. (1980) Cell 21:285-294; Odell et al. (1985) Na- 
ture 313:810-812; Shewmaker et al. (1985) Virology 140:281-288; 
Gardner et al. (1986) Plant Mol Biol 6:221- 228) oder der 19S 
CaMV Promoter (US 5,352,605; WO 84/02913; Benfey et al. (1989) 

25 EMBO J 8:2195-2202). Bin weiterer geeigneter konstitutiver Pro- 
motor ist der «Rubisco small subunit (SSU) "-Promoter (US 
4,962,028), der LegiiminB- Promoter (GenBank Acc.-Nr. X03677), 
der Promoter der Nopal insynt base aus Agrobacterium, der TR-Dop- 
pelpromotor, der OCS (Octopin Synthase) Promotor aus Agrobacte- 

30 rium, der Ubiquitin Promotor (Holtorf S et al. (1995) Plant Mol 
Biol 29:637-649), den Ubiquitin 1 Promoter (Chxistensen et al . 
(1992) Plant Mol Biol 18:675-689; Bruce et al . (1989) Proc Natl 
Acad Sci USA 86:9692-9696), den Smas Promotor, den Cinnamylal- 
koholdebydrogenase-Promotor (US 5,683,439), die Promotoren der 

35 vcikuoiarer ATPase Untereinheiten oder der Promoter eines pre- 
linreicben Proteins aus Weizen (WO 91/13991) , sowie weitere 
Promotoren von Genen, deren konstitutive Expression in Pflanzen 
dem Fachmann bekannt ist, 

40 b) Gewebespezif ische Promotoren 

Bevorzugt sind f erner Promotoren mit Spezif itaten fur die Ant- 
heren, Ovarien, Bliiten, Blatter, Stengel, Wurzeln und Samen. 

45 Samenspezif ische Promotoren wie zum Beispiel der Promoter des 
Phaseelins (US 5,504,200; Bustes MM et al. (1989) Plant Cell 
1 (9) :839-53) , des 2S Albiamingens (Joseffson LG et al. (1987) J 
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Biol Chem 262:12196-12201), des Legumins (Shirsat A et al. 
(1989) Mol Gen Genet 215(2): 326-331), des USP (unknown seed 
protein; Baumlein H et al . (1991) Mol Gen Genet 225 (3 ): 459-67 ) , 
des Napin Gens (US 5,608,152; Stalberg K et al . (1996) L Planta 
5 199:515-519) > des Sacctiarosebindeproteins (WO 00/26388) oder 

der Legumin B4-Promotor (LeB4; Baumlein H et al. (1991) Mol Gen 
Genet 225: 121-128; Baexmlein et al . (1992) Plant Journal 
2 (2): 233-9; Fiedler U et al . (1995) Biotechnology (NY) 
13 (10) : 1090f ) , der Oleosin-Promoter aus Arabidopsis (WO 

10 98/45461), der Bce4-Proinoter aus Brassica (WO 91/13980). Wei- 
tere geeignete samenspezif ische Promotoren sind die der Gene 
kodierend fur das ''Higb Molecular Weight Glutenin" (HMWG) , 
Gliadin, Verzweigiingsenzym, ADP Glucose Pyrophosphatase (AG- 
Pase) Oder die Starkesynthase . Bevorzugt sind f earner Promoto- 

15 ren, die eine samenspezif ische Expression in Monokotyledoneri 

wie Mais, Gerste,- Weizen,- Roggen, Reis etc. erlaxiben. Vorteil- 
haft eingesetzt werden kdnnen der Promoter des lpt2 oder 
Iptl-Gen (WO 95/15389, WO 95/23230) oder die Promotoren be- 
schrieben in WO 99/16890 (Promotoren des Horde in-Gens , des Glu- 

20 telin-Gens, des Oryzin-Gens, des Prolamin-Gens , des Gliadin- 
Gens, des Glutelin-Gens , des Zein-Gens, des Kasirin-Gens oder 
des Secalin-Gens) . Weitere samenspezif ische Promotoren sind be- 
schrieben in WO89/03887. 

25 Knollen-, Speicherwurzel- oder Wurzel-spezif ische Promotoren 
wie beispielsweise der Patatin Promoter Klasse I (B33) , der 
Promotor des Cathepsin D Inhibitors aus Kartoffel. 

Blattspezif ische Promotoren wie Promotor der cytosolischen 
30 FBPase aus Kartoffel (WO 97/05900), der SSU Promotor (small 

subxinit) der Rubisco (Ribulose-1, 5-bisphosphatcarboxylase) oder 
der ST-LSI Promotor aus Kartoffel (Stockhaus et* al.. (1989) EMBO 
J 8:2445-2451) . 

35 Bliitenspezif ische Promotoren wie beispielsweise der Phytoen 

Synthase Promotor (WO 92/16635) oder der Promotor des P-rr Gens 
(WO 98/22593) . 

- Antheren-spezif ische Promotoren wie den 5126-Promotor (US 
40 5,689,049, US 5,689,051), den glob-1 Promotor und den y-Zein 
Promotor . 

c)Chemisch induzierbare Promotoren 

45 Die Expressionskassetten konnen auch einen chemisch induzierba- 
ren Promotor enthalten (Ubersichtsartikel : Gatz et al. (1997) 
Annu Rev Plant Physiol Plant Mol Biol 48:89-108), durch den die 
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Expression des exogenen Gens in der Pflanze zu einem bestiinniten 
Zeitpunkt gesteuert warden kann. Derartige Promotoren, wie z.B. 
der PRPl Promoter (Ward et al. (1993.) Plant Mol Biol 
22:361-366), durch Salicylsaure induzierbarer Proiaotor (WO 
5 95/19443), ein durch Benzolsulfonamid- induzierbarer Promotor 
(EP 0 388 186), ein durch Tetrazyklin- induzierbarer Promotor 
(Gatz et al. (1992) Plant J 2:397-404), ein durch Abscisinsaure 
induzierbarer Promotor (EP 0 33 5 528) bzw. ein durch Ethanol- 
Oder Cyclohexanon- induzierbarer Promotor (WO 93/21334) konnen 
10 ebenfalls verwendet werden. 

d) Stress- oder Pathogen-induzierbare Promotoren 

Ferner sind Promotoren bevorzugt,- die durch biotischen oder ab- 
15 iotischen Stress induziert werden wie beispielsweise der patho- 
gen-induzierbare Promotor des PRPl-Gens (Ward et al. (1993) 
Plant Mol Biol -22:361-366), der hitzeinduzierbare hsp70- oder 
hsp80-Promoter aus Tomate (US 5,187,267), der kalteinduzierare 
alpha-Amylase Promoter aus der Kartoffel (WO 96/12814) , der 
20 licht-induzierbare PPDK Proiaotor oder der vejnftTundiingsinduzierte 
pinll-Promoter (EP375091) - 

Pathogen-induzierbare Promotoren umfassen die von Genen, die 
infolge eines Pathogenbef alls induziert werden wie beispiels- 

25 weise Gene von PR-Proteinen, SAR-Proteinen, P-1 , 3-Glucanase, 
Chitinase usw. (beispielsweise Redolfi et al. (1983) Neth J 
Plant Pathol 89:245-254; Uknes, et al . (1992) The Plant Cell 
4:645-656; Van Loon (1985) Plant Mol Viral 4:111-116; Marineau 
et al. (1987) Plant Mol Biol 9:335-342; Matton et al. (1987) 

30 Molecular Plant -Microbe Interactions 2:325-342; Somssich et al. 
(1986) Proc Natl Acad Sci USA 83:2427-2430; Somssich et al. 
(1988) Mol Gen Genetics 2:93-98; Chen et al. (1996) Plant J 
10:955-966; Zhang and Sing (1994) Proc Natl Acad Sci USA 
91:2507-2511; Warner, et al. (1993) Plant J 3:191-201; Siebertz 

35 et al. (1989) Plant Cell 1:961-968(1989). 

Umfasst sind auch ve3rw\ind\ings-induzierbare Promotoren wie der 
des pinll Gens (Ryan (1990) Ann Rev Phytopath 28:425-449; Duan 
et al- (1996) Nat Biotech 14:494-498), des wunl xind wun2-Gens 

40 (US 5,428,148), des winl- und win2-Gens (Stanford et al . (1989) 
Mol Gen Genet 215:200-208), des Systemin (McGurl et al. (1992) 
Science 225:1570-1573), des WIPl-Gens (Rohmeier et al. (1993) 
Plant Mol Biol 22:783-792; Eckelkamp et al. (1993) FEBS Letters 
323:73-76), des MPI-Gens (Corderok et al. (1994) The Plant J 

45 6 (2) :141-150) und dergleichen. 
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e) Entwickliingsabhangige Promotx>ren 

Weitere geeignete Promotoren sind beispielsweise f ruchtreifimg- 
spezifische Promotoren, wie beispielsweise der f ruchtreif img- 
spezifische Promotor aus Tomate (WO 94/21794, EP 409 625) . Ent- 
5 wicklungsabhangige Promotoren sclilieEt zuia Teil die Gewebespe- 
zifischen Promotoren ein, da die Ausbildung einzelner Gewebe 
naturgemaS entwicklungsabbangig erfolgt. 

Besonders bevorzugt sind konstitutive sowie samenspezif ische Pro- 
10 motor en. 

Genetische Kontrollsequenzen umfassen auch weitere Promotoren, 
Promotorelemente oder Minimalpromotoren, die die expressions teu- 
ernden Eigenschaf ten modifizieren konnen. So kann durch geneti- 

15 sche Kontrollsequenzen ziim Beispiel die gewebespezif ische Expres- 
sion zusatzlich abhangig von bestimmten Stress faktoren erfolgen. 
Entsprecbende Elemente >sind zum Beispiel. fiir Wasserstress , Absci- 
sinsaure (Lam E und Chua NH, J Biol Chem 1991; 266(26): 17131 
-17135) und Hitzestress (Schoffl F et al.. Molecular & General 

20 Genetics 217 (2-3) : 246-53 , 1989) beschrieben. 

Genetiscbe Kontrollsequenzen umfassen ferner auch die 5 ' -untrans- 
latierte Regionen, Introns oder nichtkodierende 3 '-Region von Ge- 
nen wie beipielsweise das Actin-1 Intron, oder die Adtil-S Introns 

25 1, 2 und 6 (allgemein: The Maize Handbook, Chapter 116, Freeling 
and Walbot, Eds., Springer, New York (1994)). Es ist gezeigt wor- 
den, dass diese eine signifikante Funktionen bei der Regulation 
der Genexpression spielen konnen. So wurde gezeigt, dass 5 ' -xm- 
trajislatierte Sequenzen die trsucisiente Expression heterologer 

30 Gene verstarken kSnnen. Beispielhaft fiir Translationsverstarker 
sei die 5 ' -Leaders equenz aus dem Tabak-Mosaik-Virus zu nennen 
(Gallie et al. (1987) Nucl Acids Res 15:8693-8711) und derglei- 
chen. Sie konnen f emer die Gewebsspezif itat f ordem (Rouster J 
et al. (1998) Plant. J 15:435-440). 

35 

Als Kontrollsequenzen geeignete Polyadenylierujigssignale sind 
pflanzliche Polyadenylierungssignale, vorzugsweise solche, die im 
wesentlichen T-DNA Polyadenylierungssignale aus Ag-robacterlum tu- 
mefaciens, insbesondere des Gens 3 der T-DNA (Octopin Synthase) 
40 des Ti-Plasmids pTiACHS entsprechen (Gielen et al . (1984) EMBO J 
3:835 ff) Oder funktionelle Aquivalente davon. Beispiele fiir be- 
sonders geeignete Terminatorsequenzen sind der OCS (Octopin- Syn- 
thase) -Terminator und der NOS (Nopalin-Synthase) -Terminator . 

45 Eine Expressionskassetten und die von ihr abgeleiteten Vektoren 
konnen weitere Funktionselemente enthalten. Der Begriff Funkti- 
onselement ist breit zu verstehen und meint all solche Elemente, 
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die einen Einfluss auf Herstellung, Vermehrimg oder Funktion der 
erfindungsgemSssen Expressionskassetten, Vektoren oder transgenen 
Organismen haben. Beispielhaft aber nicht einsclirankend seien zu 

• nennen : 

5 

a) Selektionsmarker, die eine Resistenz gegen einen Metabolis- 
musinhibitor wie 2-Desoxyglucose-6-phosphat (WO 98/45456), 
Antibiotika oder Biozide, bevorzugt Herbizide, wie zum Bei- 
spiel Kanamycin, G 418, Bleomycin, Hygromycin, oder Phosphi- 

10 notricin etc. verleihen. Besonders bevorzugte Selektionsmar- 

ker sind solche die eine Resistenz gegen Herbizide verleihen. 
Beispielbaft seien genannt: DNA Sequenzen, die fiir Phosphi- 
nothricinacetyltransferasen (PAT) kodieren \ind Glutaminsynt- 
haseinbiibitoren inaktivieren (bar und pat Gen) , 5-Enolpyru- 

15 vylshikiinat-3-phosphatsynthasegene (EPSP Synthasegene ) , die 

eine Resistenz gegen ' Glypbosat®. (N- (phosphonomethyl) glycin) 
verleihen, das fur das Glyphosat® degradierende Enzyme kodie- 
rende gox Gen ( Glyphosat oxidoreduktase) , das deh Gen (kodie- 
rend fur eine Dehalogenase, die Dalapon inaktiviert) , Sulfo- 

20 nylurea- \ind Imidazolinon inaktivierende Acetolactatsynthasen 

sowie bxn Gene, die fiir Bromoxynil degradierende Nitrilaseen- 
zyme kodieren, das aasa-Gen, das eine Resistenz gegen das An- 
tibiotikum Apectinomycin verleih, das Streptomycinphospho- 
transf erase (SPT) Gen, das eine Resistenz gegen Streptomycin 

25 gewahrt, das Neomycinphosphotransf eras (NPTII) Gen, das eine 

Resistenz gegen Kanamycin oder Geneticidin verleiht, das Hy- 
gromycinphospho transferase (HPT) Gen, das eine Resistenz ge- 
gen Hygromycin vermittelt, das Acetolactatsynthas Gen (ALS) , 
das eine Resistenz gegen Sulf onylhamstof f-Herbizide verleiht 

30 (z.B. mutierte ALS-Varianten mit z.B. der S4 und/ oder Hra Mu- 

tation) . 

b) Report ergene, die fur leicht quantif izierbare Proteine kodie- 
ren xind \iber Eigenf arbe oder Enzymaktivitat eine Bewertung 
35 der Trans formationseffizienz oder des Expressionsortes oder 

-zeitpunktes gewahrleisten. Ganz besonders bevorzugt sind da- 
bei Reporter-Proteine (Schenborn E, Groskreutz D. Mol Bio- 
technol. 1999; 13(1): 29-44) wie das ^green fluorescence pro- 
tein" (GFP) (Sheen et al. (1995) Plant Joiarnal 8 (5) : 777-784) , 
40 die Chi oramphenicoltransf erase, eine Luzif erase (Ow et al. • 

(1986) Science 234:856-859), das Aecjuorin-Gen (Prasher et al. 
(1985) Biochem Biophys Res Commun 126 (3 ): 1259-1268) ^ die 
p-Galactosidase, ganz besonders bevorzugt ist die p-Glucuro- 
nidase (Jefferson et al. (1987) EMBO J 6:3901-3907). 

45 
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c) Replikationsurspriinge, die eine Vermehrung der erf indungsge- 
massen Expressionskassetten oder Vektoren in zum Beispiel 
E.coli gewahrleisten. Beispielliaf t seien genarmt ORI (origin 
of DNA replication) , der pBR322 ori oder der P15A ori (Sam- 

5 brook et al . : Molecular Cloning. A Laboratory Manual, 2nd ed. 

Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 
1989). 

d) Elemente, die fiir eine Agrobakterium vermittelte Pflanzen- 

10 transformation erforderlich sind, wie zum Beispiel die rechte 

Oder linke Begrenzung der T-DNA oder die vir-Region. 

Zur Selektion erfolgreich homolog rekombinierter oder auch trans- 
formierter Zellen ist es in der Regel erforderlich, einen selek- 

15 tionierbaren Marker zusStzlich einzufulruren, der den erfolgreich 
rekombinierten Zellen eine Resistenz gegen ein Biozid (zum Bei- 
spiel ein Herbizid) , einen Metabolismusinhibitor wie 2-Desoxyglu- 
cose-6-phosphat (WO 98/45456) oder ein Antibiotikum verleiht. Der 
Selektionsmarker erlaubt die Selektion der trans formier ten Zellen 

20 von untrans formier ten (McCormick et al. (1986) Plant Cell Reports 
5:81-84) . 

Verschiedene Methoden und Vektoren zvm Einschleusen von Genen in 
das Genom von Pf lanzen sowie zur Regeneration von Pf lanzen aus 

25 Pf lanzengeweben oder Pf lanzenzellen sind bekannt (Plant Molecular 
Biology and Biotechnology (CRC Press, Boca Raton, Florida) , Kapi- 
tel 6/7, S. 71-119 (1993); White FF (1993) Vectors for Gene 
Transfer in Higher Plants; in: Transgenic Plants, Bd. 1, Enginee- 
ring and Utilization, Hrsgb. : Kung und Wu R, Academic Press, 

30 15-38; Jenes B et al . (1993) Techniques for Gene Transfer, in: 
Transgenic Plants, Bd. 1, Engineering and Utilization, Hrsgb.: 
Kung und R. Wu, Academic Press, S. 128-143; Potrykus (1991) Annu 
Rev Plsint Physiol Plant Molec Biol 42:205-225; Halford NG, Shewry 
PR (2000) Br Med Bull 56 (1) : 62-73 ) . Dazu zahlen beispielhaft die 

35 oben erwahnten. Bei Pf lanzen werden dabei die beschriebenen Me- 
thoden zur Transformation und Regeneration von Pflanzen aus 
Pf lanzengeweben oder Pf lanzenzellen zur transienten oder steibilen 
Transformation genutzt. Geeignete Methoden sind vor allem die 
Protoplastentransf ormation durch Polyethylenglykol-induzierte 

40 DNA-Auf nahme , die Liposomen vermittelte Transformation (wie z.B. 
in US 4,536,475 beschrieben) , biolistische Verfahren mit der Gen- 
kanone (** particle bombardment" Methode; Fromm ME et al . (1990) 
Bio /Technology. 8(9):833-9; Gordon-Kamm et al . (1990) The Plant 
Cell 2:603), die Elektr operation, die Inkubation trockener Em- 

45 bryonen in DNA-haltiger Losung ixad die Mikroinjektion . Im Falle 
dieser *'direkten" Transf ormationsmethoden sind keine besonderen 
Anf orderiingeh an das verwendete Plasmid gestellt. Einfache Plas- 
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mide wie die der pUC-Reihe, pBR322, MlBmp Reihe, pACYC184 etc. 
konnen verwendet werden. Sollen vollst&ndige Pflanzen aus den 

. trans formiei: ten Zellen regeneriert werden, so ist er erforder- 
lich, das sich auf dem Plasmid ein zusatzliches selektionierbares 
5 Markergen befindet. 

Neben diesen "direkten" Trans format ions techniken kann eine Trans- 
formation auch durch bakterielle Infektion mittels Agrobacterium 
(z.B. EP 0 116 718), virale Infektion mittels viraler Vektoren 
10 (EP 0 067 553; US 4,407,956; WO 95/34668; WO 93/03161) oder 

mittels Pollen (EP 0 270 356; WO 85/01856; US 4,684,611) durchge- 
fiibrt werden. 

Die fur die .Agrombacterium-Trans format ion meist verwendeten 

15 St3mme Agrobacterium tumefaciens oder Agrobacteriijm rhizogenes 
eine auch durch bakterielle Infektion mittels" enthalten ein Plas- 
mid (Ti bzw. Ri Plasmid) , das auf die Pf lanze nach Agrobateri\im- 
Infektion ubertragen wird. Ein Teil dieses Plasmids, genannt T- 
DNA (transferred DNA) , wird in das Genom der Pf lanzenzelle inte- 

20 griert. Alternativ k5nnen durch Agrobakterium auch binare vekto- 
ren (Mini-Ti-Plasmide) auf Pflanzen Obertragen und in deren Genom • 
integriert werden. Die Agrobacterium-vermittelte Transformation 
ist am besten fur dicotyledone, diploide Pf lanzenzellen geeignet, 
wohingegen die direkten Trans format ions techniken sich fiir jeden 

25 Zelltyp eignen. Verfahren zur Agrobakterium vermittelten Trans- 
formation sind beispielsweise beschrieben bei Horsch RB et al . 
(1985) Science. 225:1229f . Werden Agrobacterien verwendet, so ist 
die Expressionskassette in spezielle Plasmide zu integrieren, 
entweder in einen Zwischenvektor (englisch: shuttle or interme- 

30 diate vector) oder einen binaren Vektor. Wird ein Ti oder Ri 

Plasmid zur Transformation verwendet werden soil, ist zumindest 
die rechte Begrenzung, meistens jedoch die rechte und die linke 
Begrenzung der Ti oder Ri Plasmid T-DNA als flankierende Region 
mit der einzuftihrenden Expressionskassette verbunden. 

35 

Fiir die Agrobacterium Tranf ormation werden bevorzugt binare Vek- 
toren verwendet. Binare Vektoren konnen sowohl in E.coli als auch 
in Agrobacterium replizieren. Sie enthalten in der Regel ein Se- 
lektionsmarkergen und einen Linker oder Polylinker flankiert von 

40 der rechten und linken T-DNA Begrenzxingssequenz . Sie k5nnen di- 
rekt in Agrobacterium transf ormiert werden (Holsters et al. 
(1978) Mol Gen Genet 163:181-187). Das Selektionsmarkergen er- 
laubt eine Selektion transf ormierter Agrobakteria und ist zum 
Beispiel das nptll Gen, das eine Resistenz gegen Kanamycin ver- 

45 leiht . Das in diesem Fall als Wirtsorganismus f ungierende Agro- 
bacteriim sollte bereits ein Plasmid mit der vir-Region enthal- 
ten. Diese ist far die Ubertragxing der T-DNA auf die pflanzliche 
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Zelle erforderlich. Ein so trans formiertes Agrobacterixam kann zur 
Transformation pflanzlicher Zellen verwendet warden. Die Verwen- 
diing von T~DNA zur Transformation pflanzlicher Zellen ist inten- • 
siv untersucht imd beschrieben (EP 120 516; Hoekema, In: The Bi- 
5 nary Plant Vector System, Of f setdrukkeri j Kainters B.V., Alblas- 
serdam. Chapter V; An et al. (1985) EMBO J 4:277-287). Verschie- 
dene binare Vektoren sind bekannt und teilweise kommerziell er- 
haltlich wie zum Beispiel pBIlOl.2 oder pBIN19 (Clontech Labora- 
tories, Inc. USA; Bevan et al-(1984) Nucl Acids Res 12:8711), 
10 pBinAR, PPZP200 oder pPTV. 

Die mit einem solchen Vektor trans formier ten Agrobakterien konnen 
dann in bekannt er Weise zur Transformation von Pflanzen, ins- 
besondere von Kulturpf lanzen, wie z.B. von Raps, verwendet wer- 

15 den, indem beispielsweise verwundete Blatter oder Blattstiicke in 
einer Agrobakterienlosung gebadet und anschliessend in geeigneten 
Medien kultiviert warden. Die Transformation von Pflanzen durch 
Agrobakterien ist beschrieben (White FF, Vectors for Gene 
Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Enginee- 

20 ring and Utilization, herausgegeben von S.D. Kung und R. Wu, 

Academic Press, 1993, S. 15 - 38; Jenes B et al.(1993) Techniques 
for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and 
Utilization, herausgegeben von S.D. Kung \ind R. Wu, Academic 
Press, S. 128-143; Potrykus (1991) Annu Rev Plant Physiol Plant 

25 Molec Biol 42:205- 225). Aus den trans formier ten Zellen der ver- 
wundeten Blatter bzw. Blattstiicke konnen in bekannter Weise 
transgene Pflanzen regeneriert werden, die integriert die oben 
beschriebenen erf indungsgemSssen Expressionssysteme enthalten. 

30 Stabil trans formierte Zellen d.h. solche, die die eingefiihrte DNA 
integriert in die DNA der Wirtszelle enthalten, konnen von un- 
transf ormierten selektioniert werden, wenn ein selektionierbarer 
Marker Bestandteil der eingeftihrten DNA ist. Als Marker kann bei- 
spielhaft jedes Gen fxmgieren, dass eine Resistenz gegen Antibio- 

35 tika oder Herbizide (wie Kanamycin, G418, Bleomycin, Hygromycin 
Oder Phosphinotricin etc.) zu verleihen vermag (s.o.). Transfer- 
mierte Zellen, die ein solches Markergen exprimieren, sind in der 
Lage, in der Gegenwart von Konzentrationen eines entsprechenden 
Antibioti3cums oder Herbizides zu uberleben, die einen untransfor- 

40 mierten Wildtyp abtoten. Beispiel sind oben genannt ixnd ijmfassen 
bevorzugt das bar Gen, dass Resistenz gegen das Herbizid Phosphi- 
notricin verleiht- (Rathore KS et al. (1993) Plant Mol Biol 
21(5) : 871-884) , das nptll Gen, dass Resistenz gegen Kanamycin 
verleiht, das hpt Gen, das Resistenz gegen Hygromycin verleiht, 

45 oder das EPSP-Gen, das Resistenz gegen das Herbizid Glyphosat 
verleiht. Der Selektionsmarker erlaubt die Selektion von trans- 
f ormierten Zellen von untransf oxmierten (McCormick et al . (1986) 
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Plant Cell Reports 5:81-84). Die erhaltenen Pflanzen konnen in 
ublicher Weise geziichtet und gekxeuzt werden. Zwei oder itiehr Ge- 
nerationen sollten vorzugsweise kultiviert werden, um sicherzu- 
stellen, dass die genomische Integration stabil xind vererblich 
5 ist. 

Sobald eine trans fontiierte Pf lanzenzelle hergestellt wurde, kaim 
eine vollstandige Pflanze unter Verwendung von dem Fachmann be^ 
kannten Verfahren erhalten werden. Hierbei geht man beispielhaft 

10 von Kalluskulturen aus..Aus diesen noch undif f erenzi^rten Zell- 
massen kann die Bildung von Spross iind Wurzel in bekannter Weise 
induziert werden. Die erhaltenen Sprosslinge konnen ausgepflanzt 
imd gezuchtet werden. Entsprechende Verfahren sind beschriebe 
(Fennell et al. (1992) Plant Cell Rep. 11: 567-570; Stoeger et al 

15 (1995) Plant Cell Rep. 14:273-278; Jahne et al. (1994) Theor Appl 
Genet 89:525-533) . 

Die Wirksamkeit der Expression der transgen exprimierten Nuklein- 
sauren kann beispielsweise In vitro durch Sprossmeristemvermeh- 
20 rung Tmter Verwendung einer der oben beschriebenen Selektionsme- 
thoden enaittelt werden. Zudem kann eine in Art und Hohe veran- 
derte Expression eines Zielgens und die Auswirkung auf den Ph.an- 
ptyp der Pflanze an Testpflanzen in Gewachshausversuchen getestet 
werden - 

25 

II. Medizinische Anwendungen 

Die erf indungsgemaS bereitgestellten dsKNA, Expressionssy- 
Sterne oder Orgainismen eignen sich zur Herstellung von Arznei- 
30 mitteln zur Behandlung von menschlichen und tierischen Er- 

krankungen. Fiir eine effizient Therapie ist es oft unzxirei- 
chend nur ein einzelnes Zielgen zu vermindern. Das erfin- 
dungsgema&e Verfaliren eignet sich insbesondere zur Behandlung 
von 

35 - Pathogenbefall , wie beispielsweise virale oder bakte- 

rielle Erkrankungen . In diesen Fallen fiihren Ansatze, die 
lediflich gegen ein molekulares Ziel gerichtet sind, oft 
zu der Ausbildung von Resistenzen. Eine Koinbinat ion thera- 
pie, die mehrere Ziele abdeckt, ist jedoch kompliziert zu 

40 koordinieren und v. a. nur sehr aufwendig in klinischen 

Experiment en zu evaluieren. Das erf indxingsgemaSe Verfah- 
ren ermoglicht hier eine vorteilhafte Alternative. Die 
inhibit or ische dsRNA kann dabei in* der dem Fachmann ge- 
laufigen Weise appliziert werden. dsRNA verfvigt liber eine 

45 erstaunliche Stabilitat und ef fiziente Wirkung und kann 

beispielsweise durch Verfiitterung entsprechender dsRNA 
exprimierenden Bakterien appliziert werden. Das Verfahren 
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ei^et sich insbesondere zur Behandlung von viralen In- 
fektionen z.B. itiit dem human immimodef iciency virus" 
(HIV) , indem gleichzeitig die Expression von mindestens 
zwei viralen Gene vermindert wird, beispielsweise bei HIV- 
5 von Genen wie gp41, die fur den Zelleintritt verantwort- 

licb sind, und der viralen Replikase oder reversen Trans- 
kriptase . 

Behandlxing von Krebs (beispielsweise solider Tiomore und/ 
10 Oder Leukamien) . Zahlreiche potentialle Zielgene sind 

liier dem Fachmann bekannt (z.B. Oncogene wie ABLl, BCLl, 
BCL2, BCL6, CBFA2 , CBL, CSFlR, ERBA, ERBB, EBRB2 , FOR, 
FOS, FYN, HRAS, JUN, LCK, LYN, MYB, MYC, 3SnE^S, RET oder 
SRC; Tumor suppressorgene wie BRCAl oder BRCA2; Adhasions- 
15 molekule; Cyclinekinasen und deren Inhibitoren) . 

Weitere potentiell mit dem erf indungsgemafien Verfahren belian- 
delbare Erkrankungen und die entsprechenden Zielgene sind dem 
Fachmann ohne weiteres zuganglich und lamfassen beuspielsweise 

20 Erkrankungen des Herz/Kreislauf systems wie Bluthochdruck, Er- 

krankungen des zentralen oder peripheren Nervensystems wie 
Alzheimer, Parkinson oder multiple Sklerose usw. Auch ist es 
durch das erf indungsgemaSe Verfahren moglich, mehr als eine 
Erkrankung parallel zu behandeln, wie beispielsweise ein 

25 Herzkreilauferkrankung und eine Erkrankung des zentralen Ner- 

vensystems, was durch klassische Ansatze nicht moglich ist. 
Derartige Ansatze sind v. a. bei multiplen Erkrankungen wie 
sie oft im f ortgeschrittenen Alter auftreten vorteilhaft. 
Beispielhaft sei die parallele Behandlung von Bluthochdruck 

30 und z.B. Alzheimer oder seniler Demenz zu nennen. Dabei kann 

dieser Anwendiingen als solche isoliert angewendet werden. Na- 
tiirlich konnen .auch mehr als eine der "oben genaimten Ansatze 
gleichzeitig angewendet werden. Dabei wird bei alien Anwen- 
dungen die Expression von mindestens zwei unterschiedlichen 

35 Zielgenen vermindert. Diese Zielgene konnen dabei aus der - fur 

eine Anwendung bevorzugten Gruppe von Genen stammen oder aber 
auch unterschiedlichen Anwendungsgruppen zugeordnet sein. 



III . Biotechnologische Anwendxmgen 

40 

Das erf indungsgemaSe Verfahren laSt sich vorteilhaft in bio- 
technologischen Verfahren anwenden. Beispielhaft jedoch nicht 
einschrankend sei zu nennen die Optiiaierung von Stof fwechsel- 
wegen in fermentativ genutzten Hefen, Pilzen oder anderen eu- 
45 karyotischen Mikroorganismenoder Zellen zur Herstellung von 

Feinchemikalien wie Aminosauren (z.B. Lysin oder Methionin) , 
Vitaminen (wie Vitamin B2, Vitamin C, Vitamin E) , Carotinoi- 
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den, 6len und Fatten , polyungesattigten Fettsauren, Biotin 
usw. Dabei kann dieser Anwendnngen als solche isoliert ange- 
wendet warden. Nattirlich konnen auch mehx als eine der oben 
genannten Ansatze gleichzeitig angewendet warden. Dabai wird 
5 bei alien Anwendungen die Expression von mindestens zwei im- 

terschiedlichen Zielgenen vermindert. Diese Zielgene konnen 
dabei aus der fur eine Anwendung bevorzugten Gruppe von Genen 
stammen oder aber auch unterschiedlichen Anwendungsgruppen 
ziigeordnet sein. 

10 

Als Vektoren zur Expression in E.coli sind bevorzugt pQE70, pQE60 
\ind pQE-9 (QIAGEN, Inc.); pBluescript Vektoren, Phagescript Vek- 
toren, pNHSA, pNHlSa, pNHlSA, PNH46A (Stratagene Cloning Systems, 
Inc.).; ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5 (Pharmacia. Bio- 
15 tech, Inc . ) - 

Bevorzugte Vektoren zur eukaryotischen Expression umfassen 
pWLNEO, PSV2CAT, pOG44 , pXTl und pSG (Stratagene Inc.); pSVK3 , 
pBPV, pMSG und pSVL (Phaxroacia Biotech, Inc.). Als induzierbare 

20 Vektoren seien pTet-tTak, pTet-Splice, pcDNA4/T0, pcDNA4/TO / 
LacZ, pcDNAS/TR, pcDNA4/TO/Myc~His /LacZ, pcDNA4/T0/Myc-His A, 
pcDNA4/T0/Myc-His B, pcDNA4/T0/Myc-His C, pVgRKR (Invitrogen, 
Inc.) Oder die pMAM-Serie (Clontech, Inc.; GenBank Accession No.: 
U02443) zunennen. Diese stellen bereits das induzierbare regula- 

25 torisphe Kontrolleleitient beispielsweise fur eine chemisch, indu- 
zierbare Expression eines DSBI-Enzyms zur Verfugxing. In diese 
Vektoren kann die Nukleinsauresequenz kodierend fiir ein DSBI-En- 
zym direkt insert iert werden. 

30 Vektoren fur die Expression in Hefe umfassen baispielhaft pYES2, • 
pYDl, pTEFl/Zeo, . PYES2/GS, pPICZ,pGAPZ, pGAPZalph, pFIC9 , 
PPIC3.5, PHIL-D2, PHIL-SI, pPIC3SK, pPIC9K, und PA0815 (Invitro- 
gen , Inc . ) . 

35 Vorteilhafte Kontrollsequenzen sind beispielsweise die gram-posi- 
tiven Promotoren amy und SP02, und die Hefe- oder Pilzpromotoren 
ADCl, MFa , AC, P-60,.CYC1, GAPDH, TEF, rp28, ADH. 

Klonierungsvektoren und Techniken zur genetischen Manipulation 
40 von Ciliaten und Algen sind dem Fachmann bekannt (WO 98/01572; 

Falciatore et al. (1999) Marine Biotechnology 1 ( 3 ): 239-251 ; Duna- 
hay et al. (1995) J Phycol 31: 10004-1012) . 

Als Selaktionsmarker konnen prinipiell viele der auch fiir Pflan- 
45 zen bevorzugten Sal ektionssys tame verwendet warden. Insbesondera 
bevorzugt sind fur Saugerzelle die Neomycin (G418) Resistenz, die 
Hygromycin-Resistenz , die Zeocin-Resistenz oder die Puromycin-Re- 
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sistenz. Fiir Prokaryoten ist insbesondere die Ampicillin-Resi- 
stenz, die Kanamycin-Resistenz oder die Tetracyclin-resistent be- 
vorzugt . 

5 Prinzipiell sind fiir die Transformation tierischer Zelle oder von 
Hefezellen ahnliche Verfahren wie fiir die '"direkte" Tranf ormation 
von pflanzlichen Zellen anzuwenden. Insbesondere Verfahren wie 
die Calciumphospliat oder Liposomen vermittelte Transformation 
Oder aber Elektroporation sind bevorzugt. 

10 

Ein weiterer Gegenstand der Erfindung betrif ft die Verwendung der 
erf indungsgemassen, transgenen Organismen und der von ihnen abge- 
leitete Zellen, Zellkulturen, Telle - wie zxun Beispiel bei trans- 
genen pflanzlichen Organismen Wurzeln, Blatter etc.- , und trans- 

15 genes Vermehnmgsgut wie Saaten oder Friichte, zur Herstelliang von 
Nahrungs- oder Futtermitteln, Pharmazeutika oder Feinchemikalien, 
wie beispielsweise Enzymen, Vitaminen, Aminosauren, Zucker, Fett- 
sauren, natiirliche und synthetische Geschmacks-, Aroma- und Farb- 
stoffe. Besonders bevorzugt ist die Produktion von Triaclyglyce- 

20 riden, Lipiden, Olen, Fettsauren, Starke, Tocopherolen imd Toco- 
trienolen sowie Carotinoiden. Von Menschen und Tieren verzehrbare 
* erf indungsgemasse, genetisch veranderte Pflanzen konnen auch bei- 
spielsweise direkt oder nach an sich bekannter Aufbereitung als 
Nahrungsmittel oder Futtenaittel verwendet werden. 

25 



30 



35 



40 



45 
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Sequenzen 

1. SEQ ID NO: 1 

Nukleinsauresec[uenz kodierend fur A.thaliana Albumin 2S siib- 
5 unit 1 (GenBank Acc.-No.: M22032) 

2. SEQ ID NO: 2 

Proteins ecjuenz kodierend fiir A.thaliana Albumin 2S subunit 1 

10 3. SEQ ID NO: 3 

Nukleinsauresequenz kodierend fiir A.thaliana Albumin 2S sub- 
unit 3 (GenBank Acc.-No.: M22035) 

4. SEQ ID NO: 4 

15 Proteinsequenz kodierend ftir A.thaliana Albumin 2S subunit 3 

5. SEQ ID NO: 5 

Nukleinsauresequenz kodierend fiir A.thaliana Albumin 2S sub- 
xanit 2 (GenBank Acc.-No.: M22034) 



20 



SEQ ID NO: 6 

Proteinseq[uenz kodierend fiir A.thaliana Albumin 2S subunit 2 



7. SEQ ID NO: 7 

25 Nukleinsauresequenz kodierend fiir A.thaliana Albumin 2S sub- 

unit 4 (GenBank Acc.-No.: M22033) 

8. SEQ ID NO: 8 . 

Proteinsequenz kodierend fiir A.thalicuaa Albvimin 2S subunit 4 

30 

9. SEQ ID NO: 9 

Nukleinsauresequenz kodierend fiir B.napus Cruciferin Spei- 
cherprotein (GenBank Acc.-No.: X59294) 

35 10. SEQ ID NO: 10 

Proteinsequenz kodierend fiir B.napus Cruciferin Speicherpro- 
tein 

11. SEQ ID NO: 11 

40 Nukleinsauresequenz kodierend fiir Brassica napus Cruciferin 

(GenBank Acc.-No. : X14555) 

12. SEQ ID NO: 12 

Proteinsequenz kodierend fiir Brassica .napus Cruciferin 

45 



BNSDOCIO: <WO ^0307Be29A1J_> 



wo 03/078629 



PCT/EP03/02735 



51 

13. SEQ ID NO: 13 

Nukleinsauresequenz kodierend fiir B.napus BnC2 Cruciferin 
Speicherprotein (GenBank Acc.-No.: X59295) 

5 14. SEQ ID NO: 14 

Proteinsequenz kodierend fiir B.napus BnC2 Cruciferin Spei- 
cherprotein 

15. SEQ ID NO: 15 

10 partielle Nukleinsauresequenz kodierend fiir B.napus Crucife- 

rin cru4 subunit (GenBank Acc.-No.: X57848) 

16. SEQ ID NO: 16 

partielle Proteinsequenz kodierend fiir B.napus Cnaciferin 
15 cru4 subunit 

17 . SEQ ID NO: 17 

Nukleinsauresequenz kodierend fur B.napus crul Cruciferin 
subunit (GenBank Acc.-No - : X62120) 

20 

18. SEQ ID NO: 18 

Proteinsequenz kodierend fiir B.napus crul Cruciferin subunit 

19. SEQ ID NO: 19 

25 Nukleinsauresequenz kodierend fiir Glycinin A-la-B-x siibunit 

aus des So j abohne ( GenBank Acc . -No . : M3 6 6 8 6 ) 

20. SEQ ID NO: 20 

Proteinsequenz kodierend fiir Glycinin A-la-B-x siibunit aus 
30 des So j abohne 

21. SEQ ID NO: 21 

Nukleinsauresequenz kodierend fiir So j abohne Glycinin subunit 
' G2 (GenBank Acc.-No. : X15122*) 

35 

22 . SEQ ID NO: 22 

Proteinsequenz kodierend f^r So j abohne Glycinin subunit G2 

23 . SEQ ID NO: 23 

40 Nukleinsauresequenz kodierend fiir So j abohne A5A4B3 Glycinin 

subunits (GenBank Acc . -No . : X02626) 

24. SEQ ID NO: 24 

Proteinsequenz kodierend fiir So j abohne A5A4B3 Glycinin sub- 
45 units 
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25 . SEQ ID NO: 25 * 

Nukleinsauresequenz kodierend fiir Sojabohne (G.max) Glycinin 
Speicherprotein subnnit A3-B4 (GenBank Acc.-No.: M10962) 

5 26. SEQ ID NO: 26 

Proteinsequenz kodierend fiir Sojabohne (G.max) Glycinin Spei- 
cherprotein subunit A3-B4 

27 . SEQ ID NO: 27 
10 Nukleinsauresequenz kodierend fiir Sojabohne Glycinin subunit 

G3 (GenBank Acc.-No. : X15123) 

28. SEQ ID NO: 28 

Proteinsequenz kodierend fiir Sojabohne Glycinin subunit G3 

15 

29. SEQ ID NO: 29 

Nukleinsauresequenz kodierend fiir Sonnenblimie IIS Speicher- 
protein (G3-D1) (GenBank Acc.-No. : M28832) 

20 30. SEQ ID NO: 30 

Proteinsequenz kodierend fiir Sonnenblume IIS Speichearprotein 

{G3-D1) 

31. SEQ ID NO: 31 

25 Nukleinsauresequenz kodierend fiir Raps (B.napus) Napin (Gen- 

Bank Acc.-No.: J02586) 

32. SEQ ID NO: 32 

Proteinsequenz kodierend fiir Raps (B.napus) Napin 

30 

33. SEQ ID NO: 33 

Nukleinsauresequenz kodierend fiir Brassica juncea 28 Spei- 
cherprotein ( GenBank Acc . -No . : X6 5 040 ) 

35 34. SEQ ID NO: 34 

Proteinsequenz kodierend fur Brassica juncea 2S Speicherpro- 
tein 

35. SEQ ID NO: 35 

40 Nukleinsauresequenz kodierend fiir Brassica oleracea 2S Spei- 

cherprotein ( GenBank Acc . -No . : X6 5 0 3 8 ) 

36. SEQ ID NO: 36 

Proteinsequenz kodierend fiir Brassica oleracea 2S Speicher- 
45 protein 
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37, SEQ ID NO: 37 

Nukleinsauresequenz kodierend ftir Brassica napus cv. Topas 
Napin (GenBank Acc.-No, : U04945) 

5 38- SEQ ID NO: 38 

Proteins equenz kodierend ftir Brassica napus cv. Topas Napin 

39. SEQ ID NO: 39 

partielle Nukleinsaureseqcuenz kodierend ftir Sinapis alba sinl 
10 Speicherprotein (GenBank Acc . -No . : X91799) 

40. SEQ ID NO: 40 

partielle Proteinsequenz kodierend fxir Sinapis alba sinl 
Speicherprotein 

15 

41. SEQ ID NO: 41 

Nukleinsauresequenz kodierend fiir Sojabohne (Glycine max) na- 
pin-type 2S Albumin 1 (GenBank Acc.-No.: U71194) 

20 42. SEQ ID NO: 42 

Proteinsequenz kodierend fiir Sojabohne (Glycine max) napin- 
type 2S Albumin 1 

43. SEQ ID NO: 43 

25 Nukleinsauresequenz kodierend ftir Sojabohne (Glycine max) 2S 

Albumin (GenBaink Acc . -No. : AF005030) 

44. SEQ ID NO: 44 

Proteinsequenz kodierend fiir Sojabohne (Glycine max) 2S Albu- 
30 min 

45. SEQ ID NO: 45 

Nukleinsauresequenz kodierend fiir Brassica nigra 2S Speicher- 
protein (GenBank Ac c.^No. : X65039) 

35 

46. SEQ ID NO: 46 

Proteinsequenz kodierend fiir Brassica nigra 2S Speicherpro- 
tein 

40 47 . SEQ ID NO: 47 

Nukleinsauresecjuenz kodierend fiir Sinapis alba sin5 Speicher- 
protein (GenBank Acc.-No. : X91798) 

48. SEQ ID NO: 48 
45 Proteinsequenz kodierend fiir Sinapis alba sin5 Speicherpro- 

tein 
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49. SEQ ID NO: 49 

Nukleinsauresequenz kodierend fiir Soimenblume HaG5 2 S Albu- 
min (GenBank Acc.-No. : X06410) 

5 50. SEQ ID NO: 50 

proteinsequenz kodierend fiir Sonnenbltime HaG5 2 S Albuioin 

51. SEQ ID NO: 51 

partielle Nukleinsauresequenz kodierend fiir Sonnenbliame (He- 
10 lianthus annuus)- 2S Albxamin (GenBank Acc.-No.: X76101) 

52. SEQ ID NO: 52 

partielle Proteinsequenz kodierend fur Sonnenblxmie (Heliant- 

hus annuus) 2S Albumin 

15 

53- SEQ ID NO: 53 

Nukleinsauresequenz kodierend fiir dsRNA zur Suppression von 
Arabidopsis thai i ana 12 S Speicherprotein AtCru3 (Insert von 
Vektor pCR2 . l-AtCRU3-RNAi ) 

20 

54. SEQ ID NO: 54 

Ribonukleinsauresequenz kodierend fiir dsRNA zur Suppression 
von Arabidopsis tbaliana 12S Speicherprotein AtCru3 

25 55. SEQ ID NO: 55 

Nukleinsauresequenz kodierend fiir dsRNA zur Suppression von 
Arabidopsis thaliana 12S Speicherprotein AtCral 

56. SEQ ID NO: 56 

30 Ribonukleinsauresequenz kodierend fur dsKNA zur Suppression 

von Arabidopsis thaliana 12 S Speicherprotein AtCral 

57. SEQ ID NO: 57 

Nukleinsauresequenz kodierend fiir dsKNA zur Suppression von 
35 Arabidopsis thaliana 2S Speicherprotein At2S2 

58. SEQ ID NO: 58 

Ribonukleinsauresequenz kodierend fiir dsKNA zur Suppression 
von Arabidopsis thaliana 2S Speicherprotein At2S2 

40 

59. SEQ ID NO: 59 

Nukleinsauresequenz kodierend fiir Arabidopsis thaliana 12S 
Cruciferin Speicherprotein (ATCRU3; GenBank Acc.-No. : U66916) 



45 



BNSDOCtD: <WO ^030766294 1_l_> 



wo 03/078629 



PCT/EP03/02735 



55 

60. SEQ ID NO: 60 

Proteins equenz kodierend ftir Arabidopsis thaliana 12S Cruci- 
ferin Speicherprotein (ATCRU3) 

5 61. SEQ ID NO: 61 

Nukleinsauresequenz kodierend fiir A. thaliana 12S Speicherpro- 
tein (CRAl; GenBank Acc.-No. : M37247) 

62. EQ ID NO: 62 

10 Proteinsequenz kodierend ftir A. thaliana 12 S. Speicherprotein 

(CRAl) 

63. SEQ ID NO: 63 

Nukleinsauresequenz kodierend ftir Arabidopsis thaliana 12S 
15 Speicherprotein AT5g4412Q/MIiNl_4 (GenBank Acc.-No.: Ay070730) 

64. SEQ ID NO: 64 

Proteinsequenz kodierend fiir Arabidopsis thaliana 12 S Spei- 
cherprotein AT5g44120/MLNl_4 

20 

65. SEQ ID NO: 65 

Nukleinsauresequenz kodierend fur Arabidopsis 12S Speicher- 
protein (CRB; GenBank Ac c. -No . : X14313; M37248) 

25 66. SEQ ID NO: 66 

Proteinsequenz kodierend ftir Arabidopsis 12S Speicherprotein 
(CRB) 

67. SEQ ID NO: 67 
30 Nukleinsauresequenz kodierend fur Arabidopsis thaliana puta- 

tives 12S Speicherprotein (aus GenBank Acc.-No.: AC00.3027) 

68- SEQ ID NO: 68 

Proteinsequenz kodierend ftir Arabidopsis thaliana putatives 
35 Speicherprotein (Protein„id="AAD10679 .1) 

69. SEQ ID NO: 69 

Nukleinsauresequenz kodierend fiir Arabidopsis thaliana Cruci- 
ferin 12S Spwicherprotein (Atlg03890) (GenBank Acc.-No.: 
40 AY065432) 

70. SEQ ID NO: 70 

Proteinsequenz kodierend fiir Arabidopsis thaliana Cruciferin 
12S Speicherprotein (Atlg03890) 

45 
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71. SEQ ID NO: 71 

Niikleinsauresequenz kodierend fiir AraJDidopsis thaliana Prolii- 
bitin 1 (Atphbl) (GenBank Acc.-No. : U66594) 

5 72. SEQ ID NO: 72 

Proteinsequenz kodierend fiir Arabidopsis thaliana Prohibitin 
1 (Atplibl) 



10 



73. SEQ ID NO: 73 



74. SEQ ID NO: 74 



Oli gonukl eo t idpr imer OPNl 



Oligonnkleotidprimer OPN2 



75. SEQ ID NO: 75 



Oligonnkleotidprimer 0PN3 



15 76. SEQ ID NO: 76 



Oligonukleotidprimer 0PN4 



77. SEQ ID NO: 77 



01igonukle6t"idpriiner 0PN5 



20 



78- SEQ ID NO: 78 



79. SEQ ID NO: 79 



Oligonukleotidprimer 0PN6 



Oligonukleotidprimer 0PN7 



80. SEQ ID NO: 80 



Oligonukleotidprimer OPN8 



25 81. SEQ ID NO: 81 



Oligonukleotidprimer 0KT9 



82. SEQ ID NO: 82 



Oligonukleotidprimer OPNIO 



83. SEQ ID NO: 83 
30 NukleinsMuresequenz kodierend fiir sRNAi4-dsKNA zur Suppres- 

sion mehrerer Speicherproteine 



35 



84. SEQ ID NO: 84 

Ribonukleinsauresequenz kodierend fiir sRNAi4-dsKNA z\jLr Sup- 
pression mehrerer Speichezproteine 



40 



85. SEQ ID NO: 85 

Nukleinsauresequenz kodierend fiir sRNAi8-dsRNA zur Suppres- 
sion mehrerer Speicherproteine 

86. SEQ ID NO: 86 

RibonukleinsMuresequenz kodierend fur sRNAi8-dsRNA zur Sup- 
pression mehrerer Speicherproteine 



45 87. SEQ ID NO: 87 



Oligonukleotidprimer OPNll 
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•88. SEQ ID NO: 88 Oligonukleotidpriiaer OP12 

89. SEQ ID NO: 89 OligonukleotidprdLmer OPN13 

5 90- SEQ ID NO: 90 Oligonukleotidprimer 0PN15 

91. SEQ ID NO: 91 Oligonukleotidprimer OPN16 

92. SEQ ID NO: 92 Oligonxikleotidprimer 0PN17 

10 

93 . SEQ ID NO: 93 

Nukleinsauresequenz kodierend fur Arabidopsis thaliana *glo- 

bulin-like protein" (GenBank Acc.-No.: NiyL119834) 

15 94. SEQ ID NO: 94 . 

Proteinsequenz kodierend fiir Arabidopsis thaliana ^globulin- 
like .protein" (Protein_id=''NP_195388 . 1) 

95 . SEQ ID NO: 95 

20 Nukleinsauresequenz kodierend fiir Glycine laax 7S Samenglobu- 

lin (GenBank Acc.-No. : U59425) 

96. SEQ ID NO:* 96 

Proteinsequenz kodierend ftir fOr Glycine max IS Samenglobulin 

25 

97 . SEQ ID NO: 97 

Nukleinsauresequenz kodierend fur Zea mays 19kD Zein (GenBank 
Acc.-No.: E01144) 

30 98. SEQ ID NO: 98 

Proteinsequenz kodierend fiir Zea mays 19kD Zein 

99. SEQ ID NO: '99 

Nukleinsauresequenz kodierend ftLr Zea mays 19kD alpha Zein Bl 
35 (GenBank Acc.-No. : AF371269) 

100. SEQ ID NO: 100 

Proteinsequenz kodierend fur Zea mays 19kD alpha Zein Bl 

40 101. SEQ ID NO: 101 

Nukleinsauresequenz kodierend fiir Zea mays 19kD alpha Zein B2 
(GenBank Acc.-No.: AF371270) 

102. SEQ ID NO: 102 
45 Proteinsequenz kodierend fur Zea mays 19kD alpha Zein B2 
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103 . SEQ ID NO: 103 

Nukleinsauresequenz kodierend fiir Zea mays 22kD alpha-zein 
(GenBank Aqc.-No. : X61085) 

5 104. SEQ ID NO: 104 

Proteins equenz kodierend fiir Zea mays 22kD alpha-zein 

105. SEQ ID NO: 105 

Nukleinsauresequenz kodierend fiir Oryza sativa Prolamin 
10 . (GenBank Acc. -No. : AB016503) 



106. SEQ ID NO: 106 

Proteinsequenz kodierend fiir Oryza sativa Prolamin 

15 107. SEQ ID NO: 107 

Nukleinsauresequenz kodierend fiir A. sativa Avenin (GenBank 
Acc.-No.: M38446) 

108. SEQ ID NO: 108 

20 Proteinsequenz kodierend fiir A. sativa Avenin 

109. SEQ ID NO: 109 

Nukleinsauresequenz kodierend fiir Hordeum vulgar e C-Hordein 
(GenBank Acc.-No.: M36941) 

25 

110. SEQ ID NO: 110 

Proteinsequenz Teil 1 kodierend fiir Hordeum vulgare C-Hordein 

111 - SEQ ID NO: 111 
30 Proteinsequenz Teil 2 kodierend- fiir Hordeum vulgare C-Hordein 

. 112 . SEQ ID NO: 112 " " 

Nukleinsauresequenz kodierend fiir Triticum aestivim liMW Glu- 
tenin-lDl ( GenBank Acc . -No . : X13 306) 

35 

113 . SEQ ID NO: 113 

Proteinsequenz kodierend fiir Triticvim aestivum LMW Glute- 
nin-lDl 



40 114 . SEQ ID NO : 114 

Binarer Express ions vektor fiir Agrobakterivim vermittelte 
Pflanzentrans formation pSUN2'-USP. 



45 
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115. SEQ ID NO: 115 

Partielle NukleinsSuresequenz kodierend fiir Homogenti- 
sat-1, 2-dioxygenase aus Brassica napus (HGD; EC-Nr.: 
1.13.11.5) 

5 

116. SEQ ID NO: 116 

Nukleinsauresequenz kodierend fiir Homogentisat-l , 2-di oxyge- 
nase aus Arabidopsis thaliana (HGD; EC-Nr.: 1.13.11.5) 



10 117. SEQ ID NO: 117 

Proteinseqiienz kodierend fiir Homogentisat-l, 2-dioxygenase aus 
Arabidopsis thaliana (HGD; EC-Nr.: 1.13.11.5) 

118. SEQ ID NO: 118 

15 Nukleinsauresequenz kodierend fiir Maleylacetoacetatisomerase 

aus Arabidopsis thaliana (MAAI ; EC-Nr . : 5.2.1.2.) 

119. SEQ ID NO: 119 

Proteins equenz kodierend fiir Maleylacetoacetatisomerase aus 
20 Arabidopsis thaliana (3^1ZVAI ; EC-Nr . : 5.2.1.2.) 

120. SEQ ID NO: 12 0 

Nukleinsauresequenz kodierend fiir Fuitiarylac.etoacetathydrolase 
aus Arabidopsis thaliana ( FAAH ; EC-Nr . : 3.7.1.2) 

25 

121. SEQ ID NO: 121 

Proteinsequenz kodierend fiir Fumarylacetoacetathydrolase aus 
Arabidopsis thaliana (FAAH; EC-Nr.: 3 •7.1.2) 



30 122. SEQ ID NO: 122 

Nukleinsauresequenz kodierend fiir Supressionskonstrukt 2 
(p3300 . l-Tocl59-GFP-RNAi) 



35 123. SEQ ID NO: 123 
124. SEQ ID NO: 124 



40 



125. SEQ ID NO: 125 



126. SEQ ID NO: 126 



Oligonukleotidprimer 0PN18 
Oligonukleotidprimer 0EN19 
Oligonukleotidprimer OPN20 
Oligonukleotidprimer 0PN21 



Abbildiingen 

45 1. Fig.l: Schematische Darstellung der Speicherprotein-Suppres- 
sionskonstrukte . 
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Insert aus Vektor pCR2 . l-sRNAi4 (1) (vgl. Beispiel 2d) und 
pCR2 . l-sKNAi8 (2) (vgl. Beispiel 2e) kodierend ftir eine die 
AtCru3-, AtCRB und At2S3-Expression suppriiaierende dsRNA. 

5 In den beiden Konstrukten sind die sense "-Ribonukleotidse- 

cjuenzen und die komplementaren *'antisense"-Ribonukleotidse~ 
qiaenzen (symbolisiert durch auf dem Kopf stehende Buchstaben) 
fiir die einzelnen zu supprimierenden Zielgene (AtCru3; AtCRB, 
At2S3) iinterschiedlich angeordnet . Schraf f ierte Bereiche (II, 
10 12 etc.) stellen Intronsequenzen (Linker) dar. 



2- Fig.2A-D: Symbolische Darstellung verschiedener dsRNAs in ih- 
rer Sekimdarstruktur . 

15 SI, S2, ... S(n): * sense "-Ribonukleotidsequenz 

AS1,AS2, . . .AS(n) : ^^antisense^-Ribonukleotidsequenz 
I : Intronsequenz 

Die Anordnung der einzelnen ''sense"-Ribonukleotidsequenzen 
20 und '*antisense''-Ribonukleotidsequenzen kann so erfolgen, dass 

zunachst alle ^'sense^-Ribonukleotidsequenzen aneinander ge- 
reiht werden und so quasi einen sense "-Strang bilden, wo- 
dxauf dann alle '^antisense'^-Ribonukleotidsequenzen aneina,nder 
zu eihem "^antisense" -Strang zusammengeftigt werden (A und C) . 

25 

Altemativ kann die Anordnung der einzelnen sense "-Ribonu- 
kleotidsequenzen und ''antisense"~Ribonukleotidsequenzen so 
erfolgen, dass Paare von jeweils komplementaren " sense "-Ribo- 
nukleotidsequenzen und '^antisense'-Ribonukleotidsequenzen an- 
30 einander gefagt werden (B und D) . 

sense "-Ribonukleotidsequenzen und ''antisense"-Ribonukleotid~ 
sequenzen k6nnen direkt aneinander gefagt sein (A urid B) oder • 
aber durch weitere Sequenzen' beispielsweise Introns (I) von- 
35 einander getrennt sein (C und D) . 



3. Fig.3A-C: Symbolische Darstellung verschiedener dsRNAs in ih- 
rer Sekxindarstruktur . 

40 SI, S2, ... S(n): sense "-Ribonukleotidsequenz 

AS1,AS2, . . .AS(n) : ant i sens e"-Ribonukleot ids equenz 
SP: ^SPACER'' 

RE: Erkennungssequenz fiir Ribozym 

R: Ribozym 
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*sense"-Ribonukleotidsequenzen und '^antisense"-Ribonukleotid- 
sequenzen konnen durch weitere Sequenzen ("SPACER"; SP) von- 
einander getrennt sein (A) . Der Spacer kcum beispielsweise 
eines Erkermungsseqiaenz fiir ein Ribozym sein. Das korrespon- 
5 dierende Ribozym kann separat exprimiert werden (B) oder aber 

auch ebenfalls von deiti Spacer kodiert sein (C) . 

4. Fig. 4: Abbildimg des Supressionskonstorukts mit den entspre- 
chenden Restriktionsenzymschnittstellen: 

10 

5. Fig.SA: Identif ikation einer Pflanze, die den Albino-Ph^notyp 
zeigt (links) . Der Phanotyp ist identisch zur ppi2 Mutante, 
die Tocl59 nicht melir exprimieren kann. Als Kontrolle Pflan- 
zen mit Wildtyp Phanotyp, die parallel gewaclisen sind. 

15 

Fig, 5B: Fluor esz en z -Analyse der Pflanzen aus Fig.SA. Anre- 
gung der Fluoreszenz durch Licht im Wellenlangenbereich 
470-490 nm. Es wurde dieselbe Vergrosserimg gewahlt wie in 
Fig.SA. 
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Beispiele 

Allgemeine Methoden: 

5 Alle Chemikalien, wenn nicht anders erwahnt, stainmen von den Fir- 
laen Fluka (Buchs) , Merck (Darmstadt) , Roth (Karlsaruhe) , Serva 
(Heidelberg) land Sigma (Deisenhof en) . Restriktionsenzyme , DNA-mo- 
difizierende Enzyme imd Molekularbiologie-Kits wurden von den 
Firmen Amersham-Pharmacia (Freiburg) , Biometra (Gottingen) , Roche 

10 (Mannheim) , New England Biolabs (Schwalbach) , Novagen (Madison, 
Wisconsin, USA) , Perkin-Elmer (Weiterstadt ) , Qiagen (Hilden) , 
Stratagen (Amsterdam, Niederlande) , Invitrogen (Karlsruhe)- \jmd 
Ambion (Cambridgeshire, United Kingdom) . Die verwendeten Reagen- 
zieh wurden entsprechend der Angaben des Herstellers eingesetzt. 

15 . 

Die chemische Synthese von Oligonukleotiden kann beispielsweise, 
in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. 
Auflage, Wiley Press New York, Seite 896-897) erfolgen. Die im 
Rahmen der vorliegenden Erfindung durchgefuhrten Klonierungs- 

20 schritte wie z.B. Restriktionsspaltungen, Agarosegelelektropho- 
rese, Reinigtang von DNA-Fragmenten , Transfer von Nukleinsauren 
auf Nitrozellulose und Nylonmembranen, Verkniipfen von DNA-Frag- 
menten, Transformation von E. coli Zellen, Anzucht von Bakterien, 
Vermeharung von Phagen tmd Sequenz analyse rekombinanter DNA werden 

25 wie bei Sambrook et al. (1989) Cold Spring Harbor Laboratory 

Press; ISBN 0-87969-309-6 beschrieben durchgef lihrt . Die Seq[uen- 
zieriing rekombinanter DNA-Molekule erfolgt mit einem Laserfluo- 
reszenz— DNA-Sequenzierer der Firma ABI nach der Methode von San- 
ger (Sanger et al. (1977) Proc Natl Acad Sci USA 74:5463-5467). 

30 

Beispiel 1: Allgemeine Verfahren 

Die Pf lanze Arabidopsis thaliana reprasentiert ein Mitglied der 
35 hoheren Pflanzen (Samenpf lanzen) . Diese Pf lanze ist eng verwandt 
mit anderen Pf lanzenarten aus der Familie der Cruciferen wie z.B. 
Brassica napus, aber auch mit anderen Pflanzenf ami lien der Diko- 
tyledonen. Aufgrund des hohen Grades an Homologie ihrer DNA-Se- 
quenzen bzw. Polypeptidseguenzen kann Arabidopsis thaliana als 
40 Modellpf lanze fur andere Pf lanzenarten eingesetzt werden. 

a) Anzucht von Arabidopsis Pflanzen 

Die Pflanzen werden entweder auf Murashige-Skoog Medium mit 0,5 % 
45 Saccharose (Ogas et al . (1997) Science 277:91-94) oder auf Erde 
gezogen (Focks & Benning (1998) Plant Physiol 118:91-101). Urn 
einheitliche Keimungs- und Bliihzeiten zu erreichen, werden die 
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Samen nach Ausplattieren bzw. Ausstreuen auf Erde zwei Tage bei 4° 
C stratif iziert . Nach der Bliite warden die Sclioteii markiert. Ent- 
sprechend der Markieriongen werden daim Schoten mit einem Alter 
von 6 bis 20 Tagen nach der Bliite geerntet. 

5 

b) Isolierung von total RNA und poly-A+ RNA aus Pflanzen 

Fiir die Herstellung von Supressionskonstrukten wird RNA bzw. 
polyA+ RNA isoliert . RNA wurde aus Schoten von Arabidopsis Pflan- 

10 zen nach folgender Vorschrift isoliert: Schotenmaterial im. Alter 
von 6 bis 20 Tage nach Bluhte wurde geemtet und in fliissigem 
Stickstoff schockgef roren. Das Material wurde vor der weiteren 
Verwendung bei -80°C gelagert. 75 mg des Materials wurde im ge- 
kuhlten Morser zu einem f einem Pulver gemahlen und mit 200 ^LL des 

15 Lysis-Puffers aus dem Ambion RNAqueos-Kit versetzt . Die Isolie- 
rxing der total en RNA wurde dann nach Herstellerangaben durchge- 
fiihrt. Die RNA wurde mit. 50 |LLL Elutionspuf f er (Ambion) eluiert 
und die Konzentration durch Absorption einer 1 zu 100 verdtinnten 
Losung am Photometer (Eppendorf) bei 260 nm bestiramt. 40 |xg/ml 

20 RNA entspricht dabei einer Absorption von 1. Die RNA-Losungen 

wurden mit RNAse freiem Wasser auf eine Konzentration von 1 ^ig/|XL 
eingestellt. Die Konzentrationen wurden durch Agarosegelelektro- 
phorese iiberpruft. Zur Isolierxing von polyA+ RNA wurde 
oligo (dT) -Zellulose von Amersham Pharmacia nach Herstellerangaben 

25 verwendet. RNA bzw. polyA+ RNA wurde bei -70°C gelagert. 

c) Konstruktion der cDNA-Bank 

Zur Konstruktion der cDNA-Bank aus Arabidopsis Schoten-RNA wurde 

30 die Erststrangsynthese unter Verwendung von Reverser Transkrip- 
tase aus Maus-Leukamie-Virus (Clontech) und Oligo-d (T) -Primern, 
die Zweitstrangsynthese durch Inkubation mit DNA- Polymerase I, 
Klenow-Enzym \ind RNAse H-Spalt\mg bei 12°C (2 Std. ) , IS^'C (1 Std. ) 
und 22°C (1 Std.) erzielt. Die Reaktion wurde durch Inkubation 

35 bei 65°C (10 min) gestoppt und anschliefiend auf Eis tiberfuhrt. 
Doppelstrangige DNA-Molekule wurde mit T4-DNA~Polymerase (Ro- 
che, Mannheim) bei 37°C (30 min) mit glatten Enden versehen. Die 
Nukleotide wurden durch Phenol/Chlorof orm-Extraktion und Sepha- 
dex-G50-Zentrifugiersaulen entfernt. EcoRI/XhoI-Adapter (Pharma- 

40 cia, Freiburg, Deutschland) wurden mittels T4--DNA-Ligase (Roche, 
12 °C, uber Nacht) an die cDNA-Enden ligiert, mit Xhol nachge- 
schnitten und durch Inkubation mit Polynukleotidkinase (Roche, 
37**C, 30 min) phosphoryliert . Dieses Gemisch wurde der Trennung 
auf einem Low~Melting-Agarose-Gel unterworfen. DNA-Molekule iiber 

45 300 Basenpaaren wurden aus dem Gel eluiert. Phenol -extrahiert, 
auf Elutip-D-Saulen (Schleicher und Schiill, Dassel, Deutschland) 
konzentriert lond an Vektorarme ligiert und in lambda-ZAPII-Phagen 
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Oder lambda-ZAP-Express-Phagen imter Verwendung des Gigapack 
Gold-Kits (Stratagene, Amsterdam, Niederlande) verpackt, wobei 
Material des Herstellers verwendet und seine Anweisimgen befolgt 
wur den . 

5 

d) Isolierung von genomischer DNA aus Pflanzen wie AraJbidopsis 
thaliana Oder Brassica napus ( CTAB-Methode ) 

Zur Isoliearung genomischer DNA aus Pflanzen wie Arabidopsxs tha- 

10 liana oder Brassica napus werden ca. 0,25 g Blattmaterial jionger 
Pflanzen im vegetativen Stadium in fliissigem Stickstoff zu feinem 
Pulver gemorsert. Das pulverisierte Pf lanzenmaterial wird zusam- 
men mit 1 ml 65°C-warmem CTAB I-Puffer (CTAB: Hexadecyltrimethy- 
latnmoniumbromid, auch genannt Cetyl t rime thy lammoniumbromid; Sigma 

15 Kat.-Nr.: H6269) und 20 |Xl S-Mercaptoethanol in einen vorgewarim- 
ten zweiten M6rser gegeben \and nach vollstandiger Homogenisierung 
wird der Extrakt in ein 2 ml Eppendorf-Gef a£ uberfuhrt und fur 1 
h bei 65^C unter regelmaEiger , vorsichtiger Durchmischung inku- 
biert. Nach Abkuhlxang auf Raumtemperatur wird der Ansatz mit 1 ml 

20 Chloroform/Octanol (24:1, mit IM Tris/HCl, pH 8,0 ausgeschiittelt ) 
durch langsames • Invertieren extrahiert und zur Phasentrennung f lir 
5 min bei 8,500 rpm (7,500 x g) und Ravimtemperatur zentrif ugiert . 
AnschlieSend wird die wassrige Phase erneut mit 1 ml Chloroform/ 
Octanol extrahiert, zentrif ugiert und durch Invertieren mit 1/10 
, 25 Volumen auf 65°C vorgewarmtem CTAB Il-Puffer sorgfSltig gemischt. 
AnschlieEend wird der Ansatz durch vorsichtiges Schwenken mit 1 
ml Chi orof orm/ Octanol —Gemisch (siehe oben) versetzt und zur er— 
neuten Phasentrennung fur 5 min bei 8,500 rpm (7,500 x g) und 
Raumtemperatixr zentrif ugiert . Die w3.ssrige untere Phase wird in 

30 ein frisches Eppendorf-Gef -Qberfuhrt und die obere organische 
Phase wird in einem frischen Eppendorf ~Gef afi erneut fur 15 min 
bei 8,500 rpm (7,500 x g) und Raumtemperatur zentrifugiert . Die 
hieraus resultierende wSssrige Phase wird mit der wassrigen Phase 
des vorherigen Zentrifugationsschrittes vereinigt und der gesamte 

35 Ansatz mit exakt demselben Volumen vorgewarmtem CTAB Ill-Puffer 
versetzt. Es folgt eine Inkubation bei GS'^C, bis die DNA in 
Flocken ausfallt. Dies kann bis zu 1 h dauern oder durch Inku- 
bation bei 37**C uber Nacht erfolgen. Das aus dem anschliefienden 
Zentrifugationsschritt (5 min, 2000 rpm (500 x g) , A^C) resul- 

40 tierende Sediment wird mit 250 \il auf 65°C vorgewarmtem CTAB 

IV-Puffer versetzt uxid fur mindestens 3 0 min bzw. bis zur voll- 
st&adigen Aufl6s\mg des Sediments bei 65°C inkubiert . AnschlielSend 
wird die Losung zur Fallung der DNA mit 2,5 Volumina eiskaltem 
Ethanol vermischt xind fur Ih bei -20®C inkubiert. Altemativ 

45 kann der Ansatz mit 0.6 Voliomina Isopropanol vermischt \ind ohne 
weitere Inkubation sofort fur 15 min bei 8,500 rpm (7,500 x g) 
und 4®C zentrifugiert werden. Die sedimentierte DNA wird d\irch 
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Invertieren des Eppendorf-Gef aSes zweimal mit je 1 ml 80%igem 
eiskaltem Ethanol gewasclien, nach jedem Waschscliritt erneut zen- 
trifugiert (5 min, 8,500 rpm (7,500 x g) , 4*^0 und anschliefiend 
fiir ca. 15 min luf tgetrocknet • AbschlieEend wird die DNA in 
5 100 111 TE mit 100 |Xg/ml RNase resuspendiert und fiir 30 min bei 
Raxamtemperatur inJoobiert. Die DNA Los\mg ist nach einer weiteren 
InJcubationsphase liber Nacht bei 4*^0 homogen und kann fiir weiter- 
ftihrende Experimente .verwendet werden. . 

10 liosungen fiir CTAB: 

Losung I (fiir 200 ml) : 

100 mM Tris/HCl pH 8,0 (2,42 g) 
1,4 M NaCl (16, 36 g) 
15 20 mM EDTA (8,0 ml von 0,5 M Stamml6s\mg) 

2 %(w/v) CTAB (4,0 g) 

Jeweils vor der Verwendung werden frisch zugesetzt: 
2 % S-Mercaptoethanol (20 p.1 fiir 1 ml L5simg I) . 

20 

Losung II (fiir 200 ml) : 
0,7 M NaCl (8,18 g) 
10 %(w/v) CTAB (20 g) 

25 Losxing III (fiir 200 ml) : 

50 mM Tris/HCl pH 8,0 (1,21 g) 

10 mM EDTA (4 ml 0,5 M von 0,5 M Stammlosung) 
1 %(w/v) CTAB (2,0 g) 

30 Losung IV (High-salt TE) (fiir 200 ml) ; 

10 mM Tris/ HCl pH 8 , 0 (0,242 g) 

0,1 mM EDTA (40 Jll 0 . 5 M Stammlosung) 

1 M NaCl (11, 69 g) 

35 Chlorofoarm/Octanol (24:1) (fiir 200 ml): 
192 ml Chloroform 
8 ml Octanol 

Die Mischung wird 2x mit 1 M TrisHCl pH 8,0 ausgeschiittelt 
und vor Licht geschiitzt gelagert. 

40 

Beispiel 2 : Herstellung von Suppressionskonstrukten 

Ausgehend von der genomischer Arabidopsis thaliana DNA oder cDNA 
wurden iiber PCR mittels der auf gef iihrten Oligonukleotide f olgende 
45 Fragmente von Speicherproteinsequenzen amplif iziert . Dabei kam 
nachf olgendes PCR Protokoll z-um Einsatz: 
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Zusammensetzung des PCR-Ansatzes (50 jiL) : 

5,00 JLlL Template cDNA oder genomische DNA (ca. 1 \ig) 
5,00 JiL lOx Puffer (AdvcUitage-Polymerase) + 25 mM MgCl2 
5 5, 00 |LLL 2inM dNTP 

1,25 fiL je Primer (10 pmol/^iL) 

0,50 Advant age-Polymer as e (Clontech) 

PCR-Programm: Anf angsdenaturierving fur 2 min bei 95°C, dann 35 Zy- 
10 klexi mit 45 sec 95^*0, 45 sec 55''C und 2 min 72°C. Abschliessende 
Extension von 5 min bei 72*'C. 

a) Ausgangsvektor pCR2 . l-AtCRU3-RNAi 

15 Aus genomischer Arabidopsis thaliana DNA wird mit nachf olgendem 
Oligonukleotid-Primerpaar- ein E^onbereicb mit dem vollstSndigen 
anschlieSenden Intron einschlieSlich der an das Intron anscblie- 
Senden SpleiS-Akzeptorsequenz des 12 S Speicberprotein AtCRUS 
(Basenpaar 1947 bis 2603 der Sequenz mit der GenBank Acc.-No: 

20 U66916) amplifiziert: 

ONPl (SEQ ID NO: 134) : 

5 * -ATAAGAATGCGGCCGCGTGTTCCATTTGGCCGGAAACAAC-3 ' 

25 ONP2 (SEQ ID NO: 135): 

5 * -CCCGGATCCTTCTGTAACATTTGACAAAACATG-3 ' 

Das PCR-Produkt wird in den pCR2 . 1-TOPO Vektor (Invitrogen) ge- 
m^ss Herstellerangaben kloniert, resultierend in dem pCR2.1-l 
30 Vektor und die Sequenz iiberprilft. 

Fiir die den antisense-Strang der dsRNA kodierende Sequenz wird 
aus Arabidopsis thaliana cDNA lediglich das gleiche Exon wie oben 
(Basenpaar 1947 bis 2384) mit dem nachf olgenden Primerpaar ampli- 
35 fiziert: 

ONP3 (SEQ ID NO: 136): 

5 * ATAA(SAATGCGGCCGCGTGTTCCATTTGGCCGGAAACAAC-3 ' 

40 0NP4 (SEQ ID NO: 137): 

5 ^ ATAAGAATGCGGCCGCGGATCCACCCTGGAGAACGCCACGAGTG-3 ' 

Das PCR-Produkt wird in den pCR2.1-T0P0 Vektor (Invitrogen) ge- 
mass Herstellerangaben kloniert, resultierend in dem pCR2 . 1-2 
45 Vektor und die Sequenz liberprtift. 



BNSOCXID: <WO ^03078629A1J_> 



wo 03/078629 



PCT/EP03/02735 



67 

0,5 p,g von Vektor pCR2.1-l warden mit dem Restriktionsenzym BamHI 
(New England Biolabs) ftir 2 Stunden nach Herstellerangaben inku- 
biert und dann ftir 15 min mit alkalischer Phosphatase (New Eng- 
land Biolabs) dephosphoryliert . Der so praparierte Vektor (1 fiL) 
5 wird dann mit dem aus Vektor pCR2.1~2 gewonnenen Fragment li- 
giert. Dasu warden 0,5 |Xg von Vektor pCR2 . 1-2 2 Stunden mit BamHI 
(New England Biolabs) verdaut und die DNA~Fragmente per Gelelek- 
torphorese aufgetrennt. Das neben dem Vektor (3,9 kb) entstandene 
489 bp grosse Stuck wird aus dem Gel ausgeschnitten und mit dem 
10 *^Gelpurification"-Kit (Qiagen) nach Herstellerangaben aufgerei- 

nigt und mit 50 JIL Elutionspuf f er eluiert. 10 ILIL des Eluats we.rden 
mit Vektor pCR2.1-l (s.o.) iiber Naeht bei 16*^0 ligiert (T4 Ligase, 
New England Biolabs) . Die Ligationsprodukte warden dann in TOPiO 
Zellan (Stratagene) nach Herstellerangaben transf ormiert und ent- 
15 sprechend salektioniart . Positive Klone werden mit dem Primeirpaar 
ONPl und 0NP2 durch PGR verifiziert. Der. erhaltene Vektor wird 
pCR2.1-AtCRU3~RNAi genannt'. Die fur die dsRNA kodierdenda Nu- 
kleinsauresequenz ist durch SEQ ID NO: 105 beschrieben. 

20 b) Aus gangs vektor pCR2 . 1-AtCRB-RNAi 

Mit nachfolgendem Oligonukleotid-Primerpaar wird ein Exonbereich 
das 12S Spaicherprotain AtCRB (SEQ ID NO: 117 bzw. 118; Basenpaar 
601 bis 1874 der Sequenz mit der GenBank Acc.-No: M37248) aus 
25 Arabidopsis thaliana cDNA amplif iziert : 

0NP5 (SEQ ID NO: 138) : 

5 * ATAAGAATGCG(X:CGC(^ATCCCTCAGGGTCTTTTCTTGCCCACT-3 ' 

30 ONP6. (SEQ ID NO: 139): 

5 * -CCGCTCGAGTTTACGGATGGAGCCACGAAG-3 ' 

Das PCR-Produkt wird in den pCR2.1-T0P0 Vektor (Invitrogan) - ge- 
mass Herstellerangaben kloniert, resultierend in dem pCR2.1-3 
25 Vektor und die Sequenz iiberpruft. 

Ftir den als Linker fimgierenden Bereich wird aus Arabidopsis tha- 
liana genomischer DNA ein Intron mit den entsprechenden Spliceak- 
zeptor und -donors eguenz en der f lankierenden Exons (Basenpaar 
1874 bis 2117 der Seqpianz mit dar GenBank Acc,-No: M37248) mit 
dem nachfolganden Primerpaar amplif iziert : 

ONP7 (SEQ ID NO: 140) : 

5 * -CCGCTCGAGGTAAGCTCAACAAATCTTTAG-3 ' 
ONPB (SEQ ID NO: 141) : 

5 ' -ACGCGTCGACGCGTTCTGCGTGCAAGATATT-3 ' 
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Das PCR-Produkt wird in den pCR2.1-T0P0 Vektor (Invitrogen) ge- 
mass Herstellerangaben kloniert, resultierend JLn dem pCR2.1-4 
Vektor iind die Sequenz liberpruft. 

5 Das Konstrukt fiir AtCRB wird in einer ahnlichen Strategie wie fiir 
AtCRUS erlautert, erstellt. Vektor pCR2 . 1-3 wird mit mit Xhol 
(New England Biolabs) fiir 2 Stimden inkubiert iind dephosphory- 
liert (alkalische Phosphatase, New England Biolabs) , Vektor 
pCR2 . 1-4 wird ebenf alls mit Xhol in derselben Weise inkubiert und 
die Gelfragmente per Gelelektrophorese aufgetrennt. Die entspre- 
chenden Fragmente werden in der unter AtCRUB beschriebenen Art 
irnd Weise aufgereinigt und ligiert, resultierend nach Bakterien- 
transf ormation in dem Vektor pCR2 . 1 -AtCRB Exon/Intron. Dieser 
Vektor wird fiir 2 Stunden mit Xbal (NEB) , anschliessend fiir 15 
min mit Kl enow- Fragment (NEB) , dann fiir 2 Stunden mit Sail inku- 
biert und zuletzt 15 min mit alkalischer Phosphatase (NEB) behan- 
delt. Parallel wird der Vektor pCR2.1-3 mit BamHI (NEB), dann 15 
min mit Kl enow- Fragment xmd anschliessend 2 Stunden- mit Xhol 
(NEB) inkubiert. Das Exon-Fragment von AtCRB wird nach Gelelek- 
torphorese isoliert, gereinigt und zur Ligation eingesetzt. Beide 
Fragmente wurden dann ligiert und der Vektor pCR2 . 1-AtCRB-RNAi 
resultierte. Der erhaltene Vektor wird pCR2 . 1-AtCRB-RNAi genannt. 
Die flLr die dsRNA kodierdende NukleinsSuresequenz ist durch SEQ 
ID NO: 107 beschrieben- 

c) Aus gangs vektor pCR2 . l-At2S3-RNAi . 

Mit nachf olgendem Oligonukleotid-Primerpaar wird ein Exonbereich 
des 2S Speicherprotein At2S3 (SEQ ID NO: 3 bzw. 4; Basenpaar 212 
bis 706 der Sequenz mit der GenBank Acc.-No: M22035) amplifi- 
30 ziert: 

0NP9 (SEQ ID NO: 142): 

5 ^ -ATAAGAATGCGGCCGCGGATCCATGGCTAACAAGCTCTTCCTCGTC-3 ' 

3^ ONPIO (SEQ ID NO: 143): 

5 * -ATAAGAATGCC3GCCGCGGATCCCTAGTAGTAAGGAGGGAAGAAAG-3 ' 

Das PCR-Produkt wird in den pCR2.1-T0P0 Vektor (Invitrogen) ge- 
mass Herstellerangaben kloniert, resultierend in dem pCR2 , 1-5 
^0 Vektor und die Sequenz uberpriift. Fiir den als Linker fungierenden 
Bereich wird das gleiche Intron wie unter b) lait den Primem OPN 
7 und OPN 8 amplifiziert eingesetzt. 

Das Konstrukt fiir At2S3 wird in einer ahnlichen Strategie wie fiir 
AtCRU3 erlautert, erstellt. Vektor pCR2.1-5 wird mit mit Xhol 
(New England Biolabs) fiir 2 Stunden inkubiert und dephosphory- . 
liert (alkalische Phosphatase, New England Biolabs) . Vektor 
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PCR2.1-3 warden ebenfalls mit Xhol in derselben Weise inkubiert 
und die Gelfragmente per Gelelektrophorese aufgetrennt. Die ent- 
sprechenden Fragmente warden in der imter AtCRU3 beschxiebenen 
Art und Weise aufgereinigt und ligiert, resultierend nach Bakte- 
5 rientransf ormation in dem Vektor pCR2.1-At2S3 Exon/Intron. Dieser 
Vektor wird fiir 2 Stunden mit Sail (NEB), anschliessend fur 15 
min mit Kl enow-Fragment (NEB) inkubiert und zuletzt 15 min mit al- • 
kalischer Phosphatase (NEB) behandelt . Parallel wird der Vektor 
pCR2.1-5 mit BamHI (NEB) und dann 15 min mit Klenow-Fragment in- 
10 kubiert. Das Exon-Fragment von At2S3 wird nach Gelelektorphorese 
isoliert, gereinigt und zur Ligation eingesetzt. Beide Fragmente 
werden dann ligiert und der Vektor pCR2 . l-At2S3-RNAi resultierte. 
Die fiir die dsRNA kodierdende Nukleinsauresequenz ist durch SEQ 
ID NO: 109 beschrieben. 

15 

d) Herstelliong von Super-Supressionskonstrukt 1 

Die Vektoren pCR2 . l-AtCRU3-RNAi und pCR2 . 1-4 (siehe oben) werden 
mit den Res trikt ions enzymen Xhol und Sail fiir 2 Stunden bei 3^0 

20 inkubiert, die DNA-Fragmente durch Agarose-Gelelektrophorese auf- 
getrennt und sowohl der Vektor als auch das PCR- Insert aus 
pCR2.1-4 ausgeschnitten und mit dem ''Gelpurif ication"-Kit von 
Qiagen nach Herstellerangaben aufgereinigt und mit 50 |1L Eluti- 
onspuffer eluiert. Vom Vektor wird 1 jiL, vom PCR-Insert aus 

25 pCR2.1-4 8 JIL der Eluate ftlr die Ligation eingesetzt, resultie- 
rend in dem Konstrukt pCR2 . 1-sRNAil . Dieser Vektor wird fur 2 
Stunden mit dem Restriktionsenzym Xhol und dann fur 15 min mit 
Kl enow-Fragment inkubiert. 

30 Der Vektor pCR2 . 1-AtCRB-RNAi (siehe oben) wird mit dem Enzym 
EcoRI fiir 2 Stunden inkubiert und ebenfalls 15 min mit Klenow- 
Fragement behandelt. Beide Inkubationsansatze werden durch Gel- 
elektrophorese aufgetrennt und jeweils der Vektor (pCR2 .1-sRNAil) 
bzw. das Insert (aus pCR2 . 1-AtCRB-RNAi) aus dem Agarosegel ausge- 

35 schnitten und die DNA-Fragmente wie oben beschrieben aufgerei- 
nigt- Fiir die Ligation werden 1 ]M, des Eluates vom Vektor und 8 |XL 
des Eluates vom Insert eingesetzt und bei 4°C iiber Nacht inku- 
biert. Das resultierende Konstrukt wird mit pCR2 . l-sRNAi2 be- 
zeichnet. Der resultierende Vektor wird mit dem Enzym Xbal und 

40 anschliessend mit Kl enow-Fragment inkubiert. Der Vektor pCR2 . 1-4 
wird mit den Enzymen EcoRV und Xbal und anschliessend mit Klenow- 
Fragment inkubiert. Nach Gelelektrophorese und -reinigung wird 
das Fragment aus pCR2.1-4 mit dem Vektor pCR2 . l-sRNAi2 ligiert, 
resultierend in dem Konstrxikt pCR2 . l-sRNAi3 . Der resultierende 

45 Vektor wird dann mit dem Enzym Apal fiir 2 Stunden lond dann mit 
Kl enow-Fragment fur 15 min inkiibiert. Als Insert wird der Vektor 
pCR2 .l-At2S3-RNAi mit dem Enzym EcoRI fiir 2 Stunden xind dann mit 
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Klenow-Fragment fur 15 itiin inkubiert. Nach Gelelektropliorese lind 
-reinigung werden die Eluate ligiert, resultierend in dem Vektor 
pCR2 . l-sRNAi4 . Aus diesem Vektor wird dann das sRNAi4-Fragment 
(SEQ ID NO: 144; vgl . Fig. 1(1)), kodierend fur die super-suppri- 
5 itiierende dsKNA, durch Inkubation itiit Hindlll und Pvul ausge- 

schnitten und in den binaren Vektor pSUN-USP (SEQ ID NO: 179) li- 
giert. Das Konstrukt dient der gleichzeitigen Suppression von 
Arabidopsis thaliana Speicherproteinen CRB (SEQ ID NO: 4), CRU3 
(SEQ ID NO: 112) und At2S3 (SEQ ID NO: 118). 

10 

Der verwendete Vektor pSUN-USP ist ein binarer Vektor zur Pflan- 
zentrans formation auf Basis von pBinAR (Hofgen und Willmitzer 
(1990) Plant Science 66: 221-230). Eine gewebespezif ische Expres- 
sion Im Samen laSt sicb unter Verwendung des gewebespezif ischen 
15 Promoters USP-Promotors erzielt. 

e) * Herstellung von Super-Supressionskonstrukt 2 

Ausgehend von Arabidopsis thaliana cDNA wird ein Fragment aus dem 
20 Speicherprotein AtCRU3 (SEQ ID NO: 111, 112) mit dem naclifolgen- 
den Oligonukleotid-Primerpaar unter den in Beispiel 2 angegebenen 
PCR-Bedingungen amplif iziert : 

OPN 11: 5 ^ -AAAAGGCCTGTGTTCCATTTGGCCGGAAACAAC-3 ' (SEQ ID NO: 148) 
25 OPN 12: 5 ^ -AAAGATATCACCCTGGAGAACGCCACGAGTG-3 ' {SEQ ID NO: 149). 

Das erhaltene Fragment wird in den Vektor pCR2.1-T0P0 Vektor (In- 
vitrogen) gemass Herstellerangaben kloniert, resultierend in den 
pCR2.1-6 uind die Sequenzen iiberprtift. 

30 

Ausgehend von Arabidopsis thaliana cDNA wird ein Fargment aus dem 
Speicherprotein At2S3 (SEQ ID NO: 3, 4) mit dem nachf olgenden 
Oligonukleotid-Primerpaar unter den in Beispiel 2 angegebenen 
PCR-Bedingungen amplif iziert : 

35 

OPN 13: 5 ' -AAAAGGCCTATGGCTAACAAGCTCTTCCTCGTC-3 ' (SEQ ID NO: 150) 
OPN 14: 5 * -AAAGATATCCTAGTAGTAAGGAGGGAAGAAAG-3 ' (SEQ ID NO: 151). 

Das erhaltene Fragment wird in den Vektor pCR2.1-T0PCj Vektor (In- 
40 vitrogen) gemass Herstellerangaben kloniert, resultierend in den 
pCR2.1-7 und die Sequenzen tiberpriift. 

Aus den pCR2.1-3, pCR2 . 1-4 (siehe Beispiel 2) und pCR2 . 1-6 und 
pCR2 . 1-7 werden dajnn die Konstrukte f olgendermassen zusammen li- 
45 giert: Der Vektor pCR2 . 1-3 wird 2 Stunden mit EcoRV inkubiert und 
anschliessend 15 min mit alkalischer Phosphatase dephosphory- 
liert. Der Vektor pCR2.1-6 wird mit den Enzymen StuI \md EcoRV 
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fur 2 Stiinden inkubiert iind das PGR- Insert liber Gelelektrophorese 
iind -reinigung isoliert. Vektor pCR2.1-3 und Insert aus pCR2 . 1-6 
werden dann .iiber Nacht bei 4°C ligiert, resultierend in dein Kon- 
strukt pCR2 .l-sRNAi5. Dieser Vektor wird dann mit EcoRV inkubiert 
5 und depbosphoryliert und mit dem StuI/ EcoRV inkubiert en und ge- 
laufgereinigten Fragment aus pCR2 . 1-7 ligiert, resultierend in 
dem Konstrukt pCR2 . l-sRNAi6 . Dieser Vektor wird dann mit Xhol in- 
kubiert und dephosphoryliert . Der Vektor pCR2 . 1-4 wird mit Sail 
und Xhol inkubiert und das Insert aus pCR2.1-4 mit dem vorberei- 
10 teten Vektor pCR2 . l-sRNAi6 ligiert, resultierend in dem Konstrukt 
pCR2 . l-sRIsrAi7 . Ausgehend von pCR2 . l-sRNAi7 wird eine PGR mit den 
nachfolgenden Primerpaar unter den in Beispiel 2 gegebenen Bedin- 
gungen durchgefuhrt : 

15 OPN 15: 5^ CCGGTCGAGGTCAGGGTGTTTTCTTGCCCACT (SEQ ID NO: 152) 

OPN 16: 5*-CCGGTGGACGTAGTAGTAAGGAGGGAAGAAAG . (SEQ ID NO: 153). 

Das resultierende PCR-Produkt wird mit den Enzymen Xhol und Sail 
inkubiert. Das Fragment wird dann in den Vektor pCR2 . l-sRNAi7 

20 (inkubiert mit Xliol) ligiert, resultierend in dem Konstrukt 

pCR2 . l-sRNAi8 . Aus diesem Vektor wird dann das sRNAi 8 -Fragment * 
(SEQ ID NO: 146; vgl . Fig. 1(2)), kodierend fur die super-suppri- 
mierende dsRNA, durch Inkubation mit Hindlll und Xbal ausge- 
schnitten xind in den binaren Vektor pSUN-USP (SEQ ID NO: 179) li- 

25 giert. Das Konstrukt dient der gleichzeitigen Suppression von 
Arabidopsis thaliana Speicherproteinen CRB (SEQ ID N0:4) , CRU3 
(SEQ ID NO: 112) und At2S3 (SEQ ID NO: 118). 

Beispiel 3 : Transformation von Agrobacterium 

30 

Die Agrobacterium-vermittelte Pflanzentrans formation kann zum 
Beispiel unter Verwendung der Agrobacterium tumef aciens-Stamme 
GV3101 (pMP90) (Koncz imd Schell (1986) Mol Gen Genet 204: 383- 
396) Oder LBA4404 (Clontech) durchgefuhrt werden. Die Transfor- 
35 mation kann durch Standard-Trans f ormat ions techniken durchgefiihrt 
werden (Deblaere et al.(1984) Nucl Acids Res 13:4777-4788). 

Beispiel 4: Pflanzentrans formation 

40 Die Agrobacterium-vermittelte Pf lanzentransf ormation kann unter 
Verwendung von Standard-Transformations- uxid Regenerationstechni- 
ken durchgefuhrt werden (Gelvin, Stanton B. , Schilperoort , Robert 
A., Plant Molecular Biology Manual, 2. Auf 1 . , Dordrecht: Kluwer 
Academic Publ . , 1995, in Sect., Ringbuc Zentrale Signatur: BTll-P 

45 ISBN 0-7923-2731-4; Glick, Bernard R., Thompson, John E., Methods 
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in Plant Molecular Biology and Biotechnology, Boca Raton: CRC 
Press, 1993, 360 S., ISBN 0-8493-5164-2). 

Die Transformation mittels Agrobacterixun von Arabisopsis tbaliana 
5 wird durch die Methode nach Bechthold et al., 1993 (C.R. Acad. 
Sci. Ser. Ill Sci . Vie., 316, 1194-1199) durcligef iihrt . 
Beispielsweise kann Raps mittels Kotyledonen- oder Hypokotyl- 
trans formation transf ormiert werden (Moloney et al . , Plant Cell 
Report 8 (1989) 238-242; De Block et al.. Plant Physiol. 91 
10 (1989) 694-701) - Die Veirwendimg von Antibiotika fur die Agrobac- 
terium- und Pf lanzenselektion hangt von dem fiir die Transforma- 
tion verwendeten binSren Vektor imd Agrobacterivim-Stamm ab. Die 
Rapsselektion wird gewohnlich unter VerwendTong von Kanamycin als 
selektierbarem Pf lanzenmarker durchgefuhrt. 

15 

Der Agrobacterium-vermittelte Gentransfer in Lain (Linum usita- 
tissimum) lafit sich unter Verwendung von beispielsweise einer von 
Mlynarova et al . (1994) Plant Cell Report 13:282-285 beschriebe- 
nen Technik durchfuhren. 

20 

Die Transformation von Soja kann unter Veiiftrendung von beispiels- 
weise einer in EP-A-0 0424 047 (Pioneer Hi-Bred International) 
Oder in EP-A-0 0397 687, US 5,376,543, US 5,169,770 (University 
Toledo) beschriebenen Technik durchgefiihrt werden. 

25 

Die Pflanzentrans formation xinter Verwendung von Teilchenbe- 
schuE, Polyethylenglycol-veinnittelter DNA-Aufnahme oder liber die 
Siliziumcarbonatf aser-Technik ist beispielsweise beschrieben 
von Freeling und Walbot "The maize handbook" (1993) ISBN 
30 3-540-97826-7, Springer Verlag New York). 

Beispiel 5: Untersuchung . der Expression eines rekombinanten 
Genproduktes in einem transf ormiert en Orgeuiismus 

35 Die Aktivitat eines rekombinanten Genprodxiktes im transf ormierten 
Wirtsorganismus wurde auf der Transkriptions- und/oder der 
Translationsebene gemessen. 

Ein geeignetes Verfahren zur Bestimmung der Menge an Transkrip- 
40 tion des Gens (ein Hinweis auf die Menge an RNA, die fiir die 

Tranlation des Genproduktes zur Verfiigxing steht) ist die Durch- 
fiihrung eines Northern-Blots wie unten ausgefiihrt (als Bezugs- 
stelle siehe Ausubel et al. (1988) Current Protocols in Molecular 
Biology, Wiley: New York, oder den oben erwahnten Beispiel teil) , 
45 wobei ein Primer, der so gestaltet ist, daS er an das Gen von In- 
teresse bindet, mit einer nachweisbaren Markierung (gewohnlich 
radioaktiv oder chemilxnaineszent) markiert wird, so daS, wenn die 
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Gesamt-RNA einer Kultur des Organismus extraliiert, auf einem Gel 
aufgetrennt, auf eine stabile Matrix transferiert und mit dieser 
Sonde inkubiert wird, die Bindung ixnd das AusmaS der Bindung der 
Sonde das Vorliegen imd auch die Menge der mRNA fur dieses Gen 
5 anzeigt. Diese Information zeigt den Grad der Transkription des 
transformierten Gens an, ZellulSre Gesamt-RNA kann aus Zellen, 
Geweben oder Organen mit mehreren Verfahren, die alle im Faclige- 
biet bekannt sind, wie zum Beispiel das von Bormann, E.R., et al . 
(1992) Mol. Microbiol. 6:317-326 beschriebene, prapariert werden. 

10 

Northern-Hybridisierung : 

Fur die RNA-Hybridisierung wurden 20 ^Ig Gesamt-RNA oder 1 |Xg 
poly(A)+-RNA mittels Gelelektrophorese in Agarosegelen mit ei- 
ner Starke von 1,25 %. unter Verwendung von Formaldehyd, wie be- 

15 schrieben in Amasino (1986, Anal. Biochem. 152, 304) aufgetrennt, 
mittels Kapillaranziehung unter Verwendung von 10 x SSC auf posi- 
tiv geladene Nylonmembranen (Hybond N+, Amersham, Braunschweig) 
ubertragen, mittels UV-Licht immobilisiert und 3 Stunden bei 68°C 
unter Vearwendiing von Hybridisierungspuf f er (10 % Dextransulf at 

20 Gew./Vol., 1 M NaCl, 1.% SDS, 100 mg Heringssperma-DNA) vorhybri- 
disiert. Die Markie rung der DNA-Sonde mit dem Highprime DNA labe- 
ling-Kit (Roche, Mannheim, Deutschland) erfolgte wahrend der Vor- 
hybridisierung \mter Verwendung von alpha-32p_dCTP (Amersham Phar- 
macia, Braunschweig, Deutschland) . Die Hybridisierung wurde nach 

25 Zugabe der markierten DNA-Sonde im gleichen Puffer bei 68°C liber 
Nacht durchgeftihrt . Die Waschschritte wurden zweimal fur 15 min 
unter Verwendung von 2 X SSC und zweimal fur 30 min unter Verwen- 
dung von 1 X SSC, 1 % SDS, bei 68°C durchgef uhrt . Die Exposition 
der vers Chios senen Filter wurde bei -70°C fiir einen Zeitraum von 1 

30 bis 14 T durchgef iihrt . 

Zur Untersuchung des Vorliegens oder der relativen Menge an von 
dieser mRNA trans 1 at iertem Protein konnen Standardtechniken, wie 
ein Western-Blot, eingesetzt werden (siehe beispielsweise Ausubel 

35 et al. (1988) Current Protocols in Molecular Biology, Wiley: 

New York) . Bei diesem Verfahren werden die zellularen Gesamt-Pro- 
teine extrahiert, mittels Gelelektrophorese aufgetrennt, auf eine 
Matrix, wie Nitrozellulose, libertragen xind mit einer Sonde, wie 
einem Antikorper, der spezifisch an das gewunschte Protein bin- 

40 det, inkubiert. Diese Sonde ist gewohnlich mit einer chemilumi- 
neszenten oder kolorimetrischen Markierung versehen, die sich 
leicht nachweisen laSt. Das Vorliegen und die Menge der beobach- 
teten Markierung zeigt das Vorliegen und die Menge des gewunsch- 
ten, in der Zelle vorliegenden mutierten Proteins an. 

45 
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Beispiel 6: Analyse der Auswirkxing der rekombinanten Proteine 
auf die Produktion des gewunschteh Produktes 

Die Auswirkumg der genetischen Modifikation in Pflanzen, Pilzen, 
5 Algen, Ciliaten oder auf die Produktion einer gewunschten Verbin- 
dung (wie einer Fettsaure) kann bestimmt werden, indem die modi- 
fizierten Mikroorganismen oder die modif izierte Pf lanze unter ge- 
eigneten Bedingungen (wie den vorstehend beschriebenen) geziichtet 
warden und das Medium \ind/oder die zellularen Komponenten auf die 

10 erhohte Produktion des gewunschten Produktes (d.h. von Lipiden 
Oder einer Fettsaure) untersucht wird. Diese Analysetechniken 
sind dem Fachmann bekannt und xmfassen Spektroskopie/ Diinn- 
schichtchromatographie , Farbeverf abren verscbiedener Art, enzyma- 
tiscbe und mikrobiologische Verfabren sowie analytische Chromato- 

15 graphie, wie Hocbleistungs-Flussigkeitschroiaatographie (siehe 
beispielsweise Ullman, Encyclopedia of Industrial Chemistry, Bd. 
A2, S. 89-90 und S. 443-613, VCH: Weinbeim (1985); Fallon, A., et 
al-, (1987) "Applications of HPLC in Biochemistry" in: Laboratory 
Techniques in Biochemistry and Molecular Biology, Bd. 17; Rehm et 

20 al. (1993) Biotechnology, Bd. 3, Kapitel III: "Product recovery 
and purification", S. 469-714, VCH: Weinbeim; Belter, P. A., et 
al. (1988) Bios epar at ions: downstream processing for Biotechno- 
logy, John Wiley and Sons; Kennedy, J.F., und Cabral, J. M.S. 
(1992) Recovery processes for biological Materials,- John Wiley 

25 and Sons; Shaeiwitz, J. A., und Henry, J-D. (1988) Biochemical Se- 
parations, in: Ullmann's Encyclopedia of Industrial Chemistry, 
Bd. B3; Kapitel* 11, S. 1-27, VCH: Weinbeim; und De chow, F.J. 
(1989) Separation and purification techniques in biotechnology, 
Noyes Publications) . 

30 

Neben den oben erwShnten Verfabren werden Pf lanzenlipide aus 
Pflanzenmaterial wie von Cahoon et al. (1999) Proc. Natl. Acad. 
Sci. USA 96 (22) :12935-12940, und Browse et al. (1986) Analytic 
Biochemistry 152:141-145, beschrieben extrahiert. Die qualitative 

35 und quantitative Lipid- oder Fettsaureanalyse ist beschrieben 
bei Christie, William W. , Advances in Lipid Methodology, Ayr/ 
Scotland: Oily Press (Oily Press Lipid Library; 2); Christie, 
William W. , Gas Chromatography and Lipids. A Practical Guide - 
Ayr, Scotland: Oily Press, 1989, Repr. 1992, IX, 307 S. (Oily 

40 Press Lipid Library; 1); "Progress in Lipid Research, Oxford: 

Pergamon Press, 1 (1952) - 16 (1977) u.d.T. : Progress in the Che- 
mistry of Fats and Other Lipids CODEN. 

Zusatzlicb zur Messung des Endproduktes der Fermentation ist 
45 es auch moglich, andere Komponenten der Stof fwechselwege zu ana- 
lysieren, die zur Produktion der gevziinschten Verbindung verwendet 
werden, wie Zwischen- und Nebenpr odukte , lam die Gesamtef f izienz 
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der Produktion der Verbindxmg zu bestimmen. Die Analyseverf aliren 
umfassen Messungen der Nahrstof fmengen im Mediiam (z.B. Zucker, 
Kohlenwasserstof f Stickstof f quellen, Phosphat und andere lo- 
nen) , Messiingen der Biomassezusanvmensetzung und des Wachstums, 
5 Analyse der Produktion iiblictier Metabolite von Biosyntbesewegen 
imd Messxmgen von Gasen, die wahrend der Fermentation erzeugt 
werden. ■ Standardverf ahren ftir diese Messungen sind in Applied Mi- 
crobial Physiology; A Practical Approach, P.M. Rhodes xand P.F. 
Stanbury, Hrsgb., IRL Press, S. 103-129; 131-163 imd 165-192 
10 (ISBN:. 0199635773) und darin angegebenen Literaturstellen be- 
schrieben. 

Ein Beispiel ist die Analyse von Fettsauren (Abktirzungen: FAME, 
Fettsauremethylester; GC-MS, Gas-Flussigkeitschromatographie-Mas- 
15 senspektrometrie; TAG, Triacylglycerin; TLC, DunnschichtchLromato- 
graphie) . 

Der unzweideutige Nachweis fiir das Vorliegen von Fettsaureproduk- 
ten kann mittels Analyse rekombinanter Organismen nach Standard- 
20 Analyseverf ahren erhalten werden: GC, GC-MS oder TLC, wie ver- 
schiedentlich beschrieben von Christie und den Literaturstellen 
darin (1997, in: Advances on Lipid Methodology, Vierte Auf 1 . : 
Christie, Oily Press, Dundee, 119-169; 1998, Gaschromatographie- 
Massenspektrometrie-Verf ahren, Lipide 33:343-353). 

25 

Das zu analysierende Material kann durch Ultraschallbehandlung, 
Mahlen in der Glasmxihle, fliissigen Stickstof f und Mahlen oder 
liber andere anwendbare Verf ahren aufgebrochen werden. Das Mate- 
rial muss nach dem Aufbrechen zentrifugiert werden. Das Sediment 

30 wird in Aqua dest . resuspendiert , 10 min bei lOO'^C erhitzt, auf 
Eis. abgekxihlt und emeut zentrifugiert, gefolgt von Extraktion in 
0,5 M Schwef elsaure in Methanol mit 2 % Dimethoxypropan fur 1 
Std. bei 90^*0, was zu hydrolysierten Ol- und Lipidverbindungen 
fuhrt, die transmethylierte Lipide ergeben. Diese Fettsaxrremethy- 

"35 lester werden in Petrolether extrahiert und schlieSlich einer GC- 
Analyse unter Veirwendung einer Kapillarsaule (Chrompack, WCOT Fu- 
sed Silica, CP-Wax-52 CB, 25 mikrom, 0,32 mm) bei einem Tempera- 
turgradienten zwischen 170°C und 240**C fiir 20 min und 5 min bei 
240°C unterworfen. Die Identitat der erhaltenen Fettsauremethyle- 

40 ster muss unter Verwendung von Standards, die aus kommerziellen 
Quellen erhaltlich sind (d.h. Sigma), definiert werden. 

Fur die Ol-Analyse der mit den Supressionskonstrukten transfor- 
mierten Arabidopsis Pflanzen wird folgendes Protokoll angewendet: 

45 
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Die Extraktion der Lipide aus Samen wird nach der Methode von 
Bligh & Dyer (1959) Can J Biochem Physiol 37:911 durchgef iihrt . 
Dazu werden 5 mg Arabidopsis Samen in 1,2 ml Qiagen-Microtubes 
(Qiageyi/ Hilden) auf einer Sartorius (Got ting en) Mikrowaage abge- 
5 wogen. Das Samenitiaterial wird mit 500 uL Chloro form/Me thanol 

(2:1; en thai t Mono-C17 -glycerin von Sigma als intemen Standard) 
in der Ratschinuhle MM300 der Fintia Retsch (Haan) homogenisiert 
und 20 min bei RT inkubiert. Nach Zugabe von 500 uL 50 itiM Kalium- 
phosphatpuf f er pH 7,5 erfolgt die Phasentrenn\ing. Von der organi- 

10 schen Phase werden 50 pii abgenommen, mit 1500 uXj Chloroform ver— 
diinnt und 5 J-LL auf die Kapillaren Chromarods SIII der Firma la- 
troscan (SKS, Bechenheim) aufgetragen. Nach Auftrag der Proben 
werden diese fiir 15 min in einer Dunnschichtkammer , die gesattigt 
ist mit 6:2:2 Chloroform: Methanol: Toluol in einem ersten 

15 Schritt aufgetrennt. Nach Ablauf der Zeit werden die Kapillaren 4 
min bei Raum temper a tur getrocknet und dann ftLr 22 min in eine 
Dunnschichtkammer, die gesattigt ist mit 7:3 n-Hexan:Dieethyle- 
ther gestellt. Nach einem weiteren Trocknungsschritt fiir 4 min 
bei Raumtemperatur werden die Proben in einem latroscan MK-5 

20 (SKS, Bechenheim) entsprechend Fraser & Taggart,. 1988 J. Chroma- 
togr. 439:404 analysiert. Folgende Parameter wxirden fur die Mes- 
sungen eingestellt: Slice width 50 msec, Treshold 20 mV, Noise 
30, Skim ratio 0. Die Quantif izierung der Daten erfolgte anhand 
des internen Standards Mono-C17-glycerin (Sigma) sowie einer er- 

25 stellten Eichkurve mit Tri-C17 -glycerin (Sigma) mittels des Pro- 
gramms ChromStar <SKS, Beichenheim) . 

Fiir die quantitative Bestimmung der Olgehalte werden Samen von 
jeweils 10 Pflanzen derselben unabhangigen transgenen Linie ana- 

30 lysiert. Insgesamt wurde der Olgehalt von 30 transgene Linien der 
Tl Generation, 10 transgene Linien mit je 10 Pflanzen der T2 Ge- 
neration -und 5 transgene Linien mit je 10 Pflanzen der T3 Linien 
bestimmt. Dabei zeigen die transgenen Pflanzen einen signifikant 
hoheren Clgehalt als entsprechend gleichbehandelte Kontrollpf lan- 

35 zen. 

Beispiel 7 : 

Zum Nachweis der Funktionalitat der multiplen RNAi Konstrukte 
40 wurden Gene ausgewahlt, deren Supression einen deutlichen phano- 
logischen Effekt hervorrufen. Ein solches Gen ist zum Beispiel 
Tocl59. Dieses Gen ist essentiell fiir die Entwickliing und Funk- 
tionalitat von Chloroplasten in Arabidopsis (Bauer et al. i\fet:ure, 
403, 203-207) . Ein Ausschalten dieses Gens fiihrt zu chlorophyll- 
45 defizienten Pflanzen, deren Blatt-Erscheinungsbild dann hell-griin 
bis weiss ist. Dieser Albino-Phanotyp ist sehr leicht zu unter- 
scheiden von normalen Pflanzen. 
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Als wei teres visuelles Reprotergen wurde GFP, das griin-f luores- 
zierende Protein aus der Qualle Aec[uorea victoria eingesetzt. 
Dieses Reportergen ist ein haufig verwendetes Reportergen iri 
Pflanzen (siehe z.B. Stewart, Plant Cell Rep 2001 20 (5 ) : 376-82 ) . 
5 Ausgehend von Arabidopsis thaliana cDNA oder vom Plasiaid pEGFP 
(BD Clontech, Heidelberg, Genbank-Eintrag U476561) wurde liber PGR 
laittels der auf gefiihrten Oligonukleotide erzeugt. Dabei wurde 
folgendes Protokoll eingesetzt: 

10 Zusammensetzung des PCR-Ansatzes (50 flL) : 

5,00 liL Template cDNA oder genomische * DNA (ca. 1 \xg) 

5,00 [Jli lOx Puffer (Advantage-Polymerase) + 25 mM MgCl2 

5, 00 filj 2inM dNTP 

15 1,25 fill je Primer (10 pmol/pl,) 

0,50 |LlIi Advantage-Polymerase (Clontech) 

PCR-Prograitim: Anf angsdenaturierung fiir 2 min bei 95 °C, dann 35 Zy- 
klen mit 45 sec 95*^0, 45 sec 55^*0 und 2 min 72°C. Abschliessende 
20 Extension von 5 min bei 72 °C. 

a) Ausgangsvektor pGEM-Tocl59: Ausgehend von Arabidopsis cDNA 
wurde mit nachf olgendem Oligonukleotid-Primerpaar ein Fragment 
aus Tocl59 (Genbank Acc.-No. T14P8.24) amplif iziert : 

25 

ONP18 (SEQ ID NO: 123) : 

5 * -CTCGAGGAATTCATGGACTCAAAGTCGGTTACTCCA 

ONP19 (SEQ ID NO: 124) : 
30 5 * -GGATCCATAAGCAAGCTTTCTCACTCTCCCCATCTGTGGA 

Das PGR Produkt wurde in den Vektor pGEM-T easy von Promega 
(Mannheim) gemass Herstellerangaben kloniert, resultierend in .dem 
pGEM-Tocl59 Vektor und die Sequenz liberpriift. 

35 

b) Ausgangsvektor pGEM-GFP: Ausgehend von dem Plasmid pEGFP (BD 
Clontech, Heidelberg, GenbankAcc.-No, : U476561) wurde mit nach- 
folgendem Oligonukleotid-Primeirpaar ein Fragment aus GFP amplifi- 
ziert : 

40 

ONP20 (SEQ ID NO: 125) : 5 * -AAGCTTCCAACACTTGTCACTACTTT 
ONP21 (SEQ ID NO: 126) : 5 * -GGATCCTTAAAGCTCATCATGTTTGT 

Das PGR Produkt wurde in den Vektor pGEM-T easy von Promega 
45 (Mannheim) gemass Herstellerangaben kloniert, resultierend in dem 
pGEM-GFP Vektor und die Sequenz tiberpruft. 
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c) Herstellung des Konstruktes pGEM-159-GFP Der Vektor pGEM-GFP 
wurde mit den Restriktionsenzymen Hindlll und BamHI fiir 2 Stunden 
inkubiert . Parallel v/urde der Vektor pGEM-Tocl59 mit den gleichen 
Restriktionsenzymen inkubiert, anschliessend dann zusatzlich fur 

5 15 min mit alkalischer Phosphatase behandelt. Die alkalische 
Phosphatase wurde anschliessend durch Erhitzen auf 95 oC fiir 10 
min inaktiviert. Die entstandenen DNA-Pragmente aus beiden Ansat- 
zen wurden tiber Agarose-Gelelektrophorese aufgetrennt. Das 558 bp 
Fragment aus pGEM-GFP sowie das 3471 bp Fragment von pGEM-Tocl59 

10 wurden aus dem Gel ausgeschnitten und mit dem „Gelpurif ica- 
tion^-Kit (Qiagen) nach Herstellerangaben auf gereinigt , Beide 
Fragmente wurden fur 2 h bei 16**C ligiert (T4 Ligase, New England 
Biolabs) und anschliessend nach Herstellerangaben in E. coli DH5a 
Zellen (Stratagen) transf ormiert . Positive Klone wurden durch PGR 

15 mit dem Primerpaar OPNl und 0PN4 identif iziert xmd anschliessend 
verifiziert durch Sequenzierung. Der erhaltene Vektor wurde mit 
pGEM-159-GFP bezeichnet. 

d) Herstellung des Supressionskonstruktes 1: Der Vektor 

20 pGEM-159-GFP wurde einerseits mit den Restriktionsenzymen Xhol 
und BamHI, ein weiterer Ansatz mit BamHI und Sail inkvibiert- Der 
zweite Ansatz mit BamHI/ .Sail wurde anschliessend fiir weitere 15 
min mit alkalischer Phosphatase inkiibiert. Die DNA-Fragmente aus 
beiden Ansatzen wurden tiber Agarose-Gelelektrophorese aufgetrennt 

25 und folgende Fragmente ausgeschnitten: Ansatz BamHI-XhoI das 1091 
tsp Fragment; Ansatz BamHI-Sall das 4029 bp Fragment. Beide Frag- 
mente wurden nach Aufreinigung aus dem Agarose-Gel (siehe oben) 
fur 2 h bei 16*^0 mit T4 Ligase inlcubiert und anschliessend in E. 
coli DH5a Zellen (Stratagen) transf ormiert . Positive Klone wurden 

30 durch PGR mit dem Primerpaar OPNl ideiitif iziert und anschliessend 
verifiziert durch Sequenzierung. Der erhaltene Vektor wurde als 
Supressionskonstrxikt 1 bezeichnet. 

e) Herstellung des Supressionskonstruktes 2: Das Supressionskon- 
35 strukt 1 und der Vektor p3300.1 (Andreas Hilbrunner, Dissertation 

ETH Ztirich, 2003) wurden ftir 2h Stxmden mit dem Restriktionsenzym * 
EcoRI inkubiert. Anschliessend wurde der Vektor pBBOO.l 15 min 
mit alkalischer Phosphatase behandelt. Beide AnseLtze wurden ge- 
mischt und fiir 2 h bei 16°C mit T4 Ligase inkubiert. Der Ligati- 
40 onsansatz wurde dann in E. coli DH5a Zellen (Stratagen) transf or- 
miert. Das entstandene Supressionskonstrukt 2 wurde dann ftir die 
Agrobacterium- und Pf lanzentransf ormation eingesetzt. Die Nu- 
kleinsSuresequenz kodierend fur Supressionskonstrukt 2 
(pBBOO. l-Tocl59-GFP-RNAi) ist unter SEQ ID NO: 122 wiedergegeben . 
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Die Trans formtion von Agrobakterien vmd Pflanzen wurde wie in 
Beispiel 3 bzw. 4 beschrieben durchgef iihrt . Zum Nachweis der 
Fxmktionalitat des Supressionskonstruktes 2 vmrde dieses durch 
die nach. Bechtold et al., 1993 (C.R. Acad. Sci. Ser. Ill Sci . 
5 Vie., 316, 1194-1199) beschriebene Bltiten-Transf ormationsmethode 
in Arabidopsis trans formiert. Aus Ausgangsmaterial wurden Arabi- 
dopsis Pflanzen der Varietat Columbia-O verwendet, die bereits 
die T-DNA des binaren Vektors pBI3Sr-35S-GFP enthielten. 

10 Durch Anregung durch ultraviolettes Licht im Wellenlangenbereich 
470-490 nm die grime Fluoreszenz von GFP in diesen Pflanzen ange- 
regt werden und damit die Expression des eingebrachten Transgens 
liberpruft werden, Dazu wurden Keimlinge 1 Woche nach Keimung oder 
Blattstticke bei alteren Pflanzen mit dem Fluoreszenzmikroskop 

15 MZFLIII von Leica analysiert. Zur Anregung von GFP wurden fol- 

gende Parameter eingestellt: Quecksilberlampe HBO lOOW/DC, Filter 
GFP3, Bildbearbeitung Leica-Sof tware*. Speziell die Verwehdxing ei- 
nes Filters (GFP3), der oberhalb einer Wellenlange von 525 nm 
nicht mehr durchiassig ist, ermoglicht die GFP-Analyse von griinen 

20 Blattmaterial . Ohne diesen Filter konnte die starke Autofluores- 
zenz des Blattf arbstof f es Chlorophyll nicht ausgeschlossen wer- 
den. Die zur Transformation verwendete Arabidopsis Linie zeigte 
eine starke GFP Expression nach mikroskopischer Analyse. 

25 Trans formierte Samen wurden direkt auf Erde ausgelegt und angezo- 
gen. Nach einer Woche wurde nach Keimlingen gesucht, die keinen 
Oder einen reduzierten Anteil des Blattf arbstof fes Chlorophyll 
enthielten. Solche Pflanzen waren leicht an ihrer hellgriinen oder 
weisen Erscheinxingsbild zu erkennen. Diese Pflanzen wurden dann 

30 weiter durch Fluoreszenz-Mikroskopie untersucht und mit entspre- 
chend parallel gewachsenen griinen Pflanzen verglichen. Fig.SA 
zeigt beispielhaft ein solche identif izierte Pflanze, die sich 
deutlich in der Farbe der Blatter von parallel gewachsenen Pflan- 
zen unterscheidet . Dabei ist der Albino-Phanotyp (weisse Blatter) 

35 auf die Wirkung des Tocl59-Supressionskonstrukts zuruckzuf iihren . 
Die nicht trans formier ten Nachkommen der mit Agrobacerium- Suspen- 
sion behandelten Pflanzen zeigen den Albino-Phanotyp nicht. Der 
auftretende Albino-Phanotyp ist damit ein spezifischer Effekt des 
eingebrachten Supressionskonstruktes . 

40 

Die Fluoreszenz-mikroskopische Untersuchxing der Albino-Pf lanzen 
zeigte dann (Fig.SB), dass keine GFP-Signale in solchen Pflanzen 
gefunden werden konnte. Im Vergleich dazu zeigten die parallel 
gewachsenen griinen Pflanzen deutliche GFP Signale. Die Abwesen- 
45 heit des GFP-Signals in alien identif izierten Albino-Pf lanzen de- 
monstriert die Funktionalitat des Supressionskonstruktes, denn 
nur die mit dem Supressionkonstrukt treinsf ormierten Pflanzen 
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zeigten keine GFP-Signale mehr. Es koimte keine Segregation der 
beiden angestrebten Ph&iotypeii beobachtet werden. Damit konnte 
gezeigt werden, dass durch Verwendung von nur einem Kontrollele- 
itient (Promotor) zwei funktionell vollig unterschiedliche Gene, 
5 die ihrerseits durch unterschiedliche Kontrollelemente in ihrer 
Expression reguliert werden, ausgeschaltet werden konnten. 
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-Patent anspriiche 

1- Verfahren zur Vermindeaning der Expression von mindestens zwei 
5 verschiedenen, endogenen Zielgenen in einer eukaryotischen 

Zelle Oder einem eukaryotische Organismus durch Ein±)ringen 
eines ziamindest teilweise doppelstrangigen Ribonukleinsaure- 
molekuls in besagte eukaryotische Zelle oder besagten euka- 
ryotischen Organismus, wobei das doppelstrangige Ribonuklein- 
10 sauremolekul umfasst 

a) mindestens zwei ^sense^-Ribonukleotidseqiienzen, wobei je- 
weils mindestens eine dieser " sense "-Ribonukleot idseqxien- 
zen im wesentlichen identisch ist zu mindestens einem 

15 Teil des sense ''-RNA-Transkriptes eines jeden der besag- 

ten endogenen Zielgene xmd 

b) ''antisense"-Ribonukleotidsequenzen, die zu besagten 

sense "-Ribonukleotidsequenzen unter a) im wesentlichen 
20 komplementa;ren sind. 

2- Verfahren nach Anspruch 1, wobei die transkribierten RNAs von 
mindestens zwei der in ihrer Expression verminderten Zielgene 
untereinander eine Homologie von unter 90% haben. 

25 

3. Verfahren nach Anspruch 1 oder 2, wobei die doppelstrangige 
RNA durch ein einziges selbstkomplementares Ribonukleotidmo- 
lekai gebildet wird. 

30 4. Verfahren nach einem der Anspruche 1 bis 3, wobei mindestens 
eine der ausgehend von den einzelnen " sense "-Ribonukleotidse- 
quenzen gebildeten doppelstrangigen RNA-Strukturen eine Lange 
eines geradzahligen Vielfachen von 21 oder 22 Basenpaaren 
hat. 

35 

5. Verfahren nach einem der Anspruche 1 bis 4, wobei das Ribonu- 
kleotidmolekQl zwischen mindestens einer ^ sense ''-Ribonukleo- 
tidsequenz und der dazu im wesentlichen kon^lementaren ^anti- 
sense "-Ribonukleotidsequenz eine Ribonukleotidsequenz kodie- 
40 rend fiir ein Intron enthalt. 



45 5 Zeichn. 
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6 . Verf ahren nach einem der Anspriiche 1 bis 5 , dadurcli gekenn- 
zeichnet, dass mindestens zwei der endogenen Zielgene ausge- 
wahlt sind aus jeweils unterschiedlichen Klassen von Spei- 
cherprotein ausgewah.lt aus den Speicherprotein-Klassen der 
5 2S-Alb\Jiaine, 7S-Globuline, llS/12S~Globuline oder Zein-Prola- 

mine . 



7. Verf ahren nach einem der Anspriiche 1 bis 6, wobei mindestens 
eine " sense "-Ribonukleot ids ecjuenz im wesentlichen identisch 
10 ist zu mindestens einem Teil des sense "-RNA-Transkriptes 

a) einer Speicherprotein-Nukleinsauresequenz gemas SEQ ID 
NO: 1, 3, 5, 7, 9, 11, 13, 15 , 17, 19, 21, 23, 25, 27, 
29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 59, 61, 

15 63, 65, 67, 69, 71, 93, 95, 97, 99, 101, 103, 105, 107, 

109 Oder 112, oder 

b) eines Gens aus dem Homogentisatabbauweg gemaS SEQ ID NO: 
115, 116, 118 Oder 120, oder 

20 

c) eines Gens ausgewahlt aus der Gruppe bestehend aus Ace- 
tyl transacylasen, Acyltransportproteinen, Fettsauredesa- 
turasen, Malonyltransacylasen , P-Ketoacyl-ACP-syntheta- 
sen , 3 -Keto-ACP-reduktasen, Enoyl-ACP-hydrasen , Thioes t e- 

25 rasen, Enoyl-ACP-r eduktasen , ADP-Glucosepyrophosphoryla- 

sen, Phosphorylasen, Starkesynthetasen, Q-Enzymen, Su- 
crose-6-phosphatsynthetasen. Sucrose- 6 -phosphatphosphata- 
sen , ADP-Glucosepyrophosphorylasen , Branching-Enzymen , 
Debranching-Enzymen, Amylasen, Chalconsynthasen, Chalco- 

30 nisomerasen, Phenylalaninammonialyasen, Dehydrokaempf e- 

rol {flavone)hydroxylasen, Dihydrof lavonolreduktasen, Di- 
hydrof lavanol-2-hydroxylasen, Flavonoid-3 ' -hydroxylasen, 
Flavonoid-5 ' -hydroxylasen, Flavonoidglycosyltransf erasen, 
Flavonoidmethyltrcuisferasen, Flavonoidacyl trans f erasen, 

35 Polygalacturonasen, Cellulasen, Pectinesterasen, 

( 1-4 ) Glucanasen, ^-Galactanasen, 1-Aminocyclopro- 
P9-^^-l"<^3^rt)o^lat synthasen , Phy toendesaturasen , Cinnamoyl- 
CoA : NT^PH-Reduktasen , Cinnamoylalkoholdebydrogenasen , 
Cof feinsaxire-O-methyltransferasenn Cinnamoylalkoholdehy- 

^O drogenasen, Polyphenoloxidasen, Homogentisat-1, 2-dioxyge- 

nasen, Maleylacetoacetatisomerasen, Famarylacetoacetathy- 
drolasen , N-Methyl-putrescinoxidasen, Putrescin-N-methyl- 
transf erasen, 7-Methylxanthine-3 -me thyltransf erasen, 
1-Me thy lxanthin-3 -methyl transf erasen und Threoninsyntha- 

45 sen. 
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8.. Ribonukleinsauremolekul , das eine zumindest teilweise doppel- 
strangige Struktur liat und vimfasst 

a) mindest.ens zwei sense "-Ribonukleot ids equenzen, wobei je- 
5 weils mindestens eine dieser 

sense" -Ribonukleotidsequenzen im wesent lichen identisch 
ist zu mindestens einem Teil des sense "-RNA-Transkriptes 
eines endogenen Zielgens, wobei jedoch nicht alle 

sense "-Ribonukleotidsequenz en zu dem sense "-RNA-Trans- 
10 kript eines einzigen endogenen Zielgens im wesentlichen 

identisch sind, xind 

b) *^antisense"-Ribonukleotidsequenzen, die zu besagten 

sense" -Ribonukleotidsequenzen unter a) im wesentlichen 
15 komplementaren sind, 

9. Ribonukleinsauremolekul nach Anspruch 8, wobei das Ribonu- 
kleinsauremolekiil wie in einem der Anspriiche 2 bis 7 gekenn- 
zeichnet ist. 

20 

10. Transgene Expressionskassette enthaltend in f unktioneller 
Verknupfung mit einem Promotor eine Nukleinsaureseqxienz 
kodierend ftir doppelstrangiges Ribonukleinsauremolekul gemaS 
einem der Anspriiche 8 oder 9, wobei das Ribonukleinsauremole- 

25 kiil aus einem einzigen RNA-Strang gebildet wird. 

11. Transgenes Expressionssystem enthaltend 

a) in ftinktioneller Verknupfung mit einem Promotor eine 

30 Nukleinsaureseguenz kodierend fur ^ sense "-Ribonukleotid- 

sequenzen eines doppelstrangigen Ribonukleinsauremolekuls 
gemaE einem der Anspruche 8 oder 9 und 

b) in f\mkt lonelier Verknupfung mit einem Promotor eine 

35 Nukleinsauresequenz kodierend fiir *'antisense"-Ribonukleo- 

tidsequenzen eines doppelstrangigen Ribonukleinsauremole-- 
kills gem§.fi einem der Ansprtlche 8 oder 9, 

wobei das Ribonukleinsauremolekul aus den beiden unter a) 
40 und b) definierten Strangen gebildet wird, und die Promotoren 

so gewahlt sind, das in einem bestimmten Organismus oder 
Zelle die .gleichzeitige Expression von ''sense^-Ribonukleotid- 
sequenzen und. "'antisense^-Riboniikleotidsequenzen gewahrlei- 
stet ist. 
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12. Transgener Vektor enthaltend eine transgene Expressions- 

kassette gemcLS Anspruch 10 oder ein transgenes Expressions- 
system gemafi Anspruch 11. 

5 13 . Transgener Organismus enthaltend eine transgene Expressions- 
kassette geiaaS Anspruch 10 oder ein transgenes Expressions- 
system gemSB Anspruch 11 oder einen transgenen Vektor gemafi 
Anspruch 12 . 

10 14. Transgener Organismus nach Anspruch 13 ausgewahlt aus der 
Gruppe bestehend aus Bakterien, Hefen, nicht-menschlichen 
Tieren und Pflanzen. 

15 - Transgener Organismus nach Anspruche 13 , dadurch gekenn- 
15 zeichnet, dass die Pflanze ausgewahlt ist aus der Gruppe der 

landwirtschaf tlichen Nutzpf lanzen. 

16. Verwendxing eines Ribonukleotidmolekuls nach einem der Anspru- 
che 8 Oder 9, einer transgenen Expressionskassette gemaE An- 

20 spiruch 10, eines transgenen Expressionssystem gemaE Anspruch 

11, eines transgenen Vektors gemal^ Anspruch 12 oder eines 
transgenen Organismus gemaS einem der Anspruche 13 bis 15 zur 
Herstellung von Arzneimitteln, in biotechnologischen Verfah- 
ren oder in der Pf Icuizenbiotechnologie . 

25 

17. Verwendung nach Anspruch 16, wobei mindestens einer der nach- 
folgenden Eigenschaften in Pflanzen erzielt wird: 



30 



35 



a) Verbesserter Schutz gegen abiotische Stressf aktoren 

b) Modifikation der Zusammensetzung und/oder des Gehaltes an 
Fettsauren, Lipiden oder Olen 

c) * Modifikation der Kohlenhydratzusammensetzxmg 

d) Veranderung der Farbe oder Pigment ierung 

e) Verminderung des Gehaltes von Speicherprot einen 

40 f ) Erreichen einer Resistenz gegen pflanzliche Pathogene 

g) Verhinderung von Halmbruch 

h) Verzogerung der Fruchtreifiing 

i) Erzielen einer mannlichen Sterilitat 



45 
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j) Verminderung unerwunschter oder toxischer Pf lanzenin- 
haltsstof fe 

k) Verzogerung von Alterserscheinxingen 

1) Modifikation der Lignif ikation und/oder des Ligningehal- 
tes 

iti) Modifikation des Paseranteils in Nahrungsmitteln oder der 
Faserqualitat in Baumwolle 

n) Verminderung der Sto£anf alligkeit 

o) Steigerung der Vitamin E Biosyntbese 



15 



p) Verminderung des Nikotingehaltes, des Cof f eingehaltes 
Oder des Theophyllin-Gehaltes 

q) Erhohung des Methioningehaltes durch Verminderung der 
2 0 Threoninbiosynthese 



25 



30 



35 
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SEQUEN2PROTOKOLL 

<110> BASF Plant Science GmbH 

<120> Konstrukte und Verfaliren zur Regulation der 

Genexpr es s i on 

<130> PD009300062-AT 

<140> 
<141> 

<160> 126 

<170> Patentin Ver. 2.1 

<210> 1 
<211> 495 
<212> DNA 

<213> Arabidopsis tlialiana 

<220> 

<221> CDS 

<222> (1).,{492) 

<223> albumine' 2S subunit 1 

<400> 1 

atg gca aac aag ttg ttc etc gtc tgc gca get etc get etc tgc ttc 48 

Met Ala Asn Lys Leu Pbe Leu Val Cys Ala Ala Leu Ala Leu Cys Pbe 
15 10 15 

etc etc ace aac get tee ate tac cgc ace gtc gtt gag ttc gaa gaa 96 
Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Glu Glu 
20 25 30 

gat gac gcc act aac ecc ata ggc cca aaa atg agg aaa tgc cgc aag 144 
Asp Asp Ala Thr Asn Pro He Gly Pro Lys Met Arg Lys Cys Arg Lys 
35 40 45 

gag ttt eag aaa gaa caa cac eta aga get tgc cag caa ttg atg etc 192 
Glu Phe Gin Lys Glu Gin His Leu Arg Ala Cys Gin Gin Leu Met Leu 
50 55 60 

cag caa gca agg caa ggc cgt age gat gag ttt gat ttc gaa gac gac 240 
Gin Glri Ala Arg Gin Gly Arg Ser Asp Glu Phe Asp Phe Glu Asp Asp 
65 70 75 80 

atg gag aac cca cag gga caa cag cag gaa caa cag eta ttc eag eag 288 
Met Glu Asn Pro Gin Gly Gin Gin Gin Glu Gin Gin Leu Phe Gin Gin 

85 90 95 

tgc tgc aac gag ett cgc eag gaa gag cca gat tgt gtt tgc ecc ace 336 
Cys Cys Asn Glu Leu Arg Gin Glu Glu Pro Asp Cys Val Cys Pro Thr 
100 105 110 

ttg aaa caa get gee aag gcc gtt aga etc cag gga cag cac caa cca 3 84 
Leu Lys Gin Ala Ala Lys Ala Val Arg Leu Gin Gly Gin His Gin Pro 

115 120 125 

atg caa gtc agg aaa att tac cag aca gcc aag cac ttg ecc aac gtt 432 
Met Gin Val Arg Lys He Tyr Gin Thr Ala Lys His Leu Pro Asn Val 
130 135 140 

tgc gac ate ecg caa gtt gat gtt tgt ecc ttc aac ate cct tea ttc 480 
Cys Asp He Pro Gin Val Asp Val Cys Pro Phe Asn He Pro Ser Phe 
145 150 155 160 

cct tct ttc tac taa 495 
Pro Ser Phe Tyr 
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<210> 2 
<211> 164 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 2 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Ala Leu Ala Leu Cys Phe 

1-5 10 15 

Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Plie Glu Glu 
20 25 30 

Asp Asp Ala Thr Asn Pro He Gly Pro Lys Met Arg Lys Cys Arg Lys 
35 40 45 

Glu Ph.e Gin Lys Glu Gin His Leu Arg Ala Cys Gin Gin Leu Met Leu 
50 55 60 

Gin Gin Ala Arg Gin Gly Arg Ser Asp Glu Phe Asp Phe Glu Asp Asp 
65 70 75 80 

Met Glu Asn Pro Gin Gly Gin Gin Gin Glu Gin Gin Leu Phe Gin Gin 

85 90 95 

Cys Cys Asn Glu Leu Arg Gin Glu Glu Pro Asp Cys Val Cys Pro Thr 
100 105 110 

Leu Lys Gin Ala Ala Lys Ala Val Arg Leu Gin Gly Gin His Gin Pro 
115 120 125 

Met Gin Val Arg Lys He Tyr Gin Thr Ala Lys His Leu Pro Asn Val 
130 135 140 

Cys Asp He Pro Gin Val Asp Val Cys Pro Phe Asn He Pro Ser Phe 
145 150 155 160 

Pro Ser Phe Tyr 



<210> 3 
<211> 495 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (492) 

<223> albumine 2S sxibunit 3 

<400> 3 

atg get aac aag etc ttc etc gtc tgc gca act etc gee etc tgc tte 48 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Leu Ala Leu Cys Phe 
15 10 15 

etc etc ace aac get tec ate tac cge acc gtt gtc gaa ttc gaa gaa 96 
Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Glu Glu 
20 25 30 . 

gat gac gee age aac cec gta ggt oca aga eag aga tgc cag aag gag 144 
Asp Asp Ala Ser Asn Pro Val Gly Pro Arg Gin Arg Cys Gin Lys Glu 
35 40 45 

ttt cag caa tea caa cae eta aga get tgc cag aga tgg atg age aag 192 
Phe Gin Gin Ser Gin His Leu Arg Ala Cys Gin Arg Trp Met Ser Lys 
50 55 60 
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240 



288 



432 



480 



495 



caa atg agg caa gga cgt ggt ggt ggt cct tec etc gae gat gag tte 
Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 

70 75 80 

gat ttc gag ggc ccc cag cag gga tac cag eta etc eag cag tgc tgc 
Asp Phe Glu Gly Pro Gin Gin Gly Tyr Gin Leu Leu Gin Gin Cys Cys 

85 90 95 

aac gag ctt cgc cag gaa gag cca gtt tgc gtt tgc ccc acc ttg aaa 336 
Asn Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro .Thr Leu Lys 

100 105 110 

caa get gee agg gca gtt age etc cag gga eag cac gga cca ttc caa 384 
Gin Ala Ala Arg Ala Val Ser Leu Gin Gly Gin His Gly Pro Phe Gin 
115 120 125 

tec agg aaa att tac cag tea get aag tac ttg eet aac att tgc aag 
Ser Arg Lys lie Tyr Gin Ser Ala Lys Tyr Leu Pro Asn lie Cys Lys 
130 135 140 

ate cag caa gtt ggt gaa tgt ccc tte cag ace ace ate eet ttc tte 
He Gin Gin Val Gly Glu Cys Pro Phe Gin Thr Thr He Pro Phe Phe 

150 155 160 

cct eet tac tac tag 
Pro Pro Tyr Tyr 

<210> 4 
<211> 164 
<212> PRT 

<213> Aratoidopsis thaliana 
<400> 4 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Leu Ala Leu Cys Phe 

^ 5 10 .15 

Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Glu Glu 
20 25 30 

Asp Asp Ala Ser Asn Pro Val Gly Pro Arg Gin Arg Cys Gin Lys Glu 
35 40 45 

Phe Gin Gin Ser Gin His Leu Arg Ala Cys Gin Arg Trp Met Ser Lvs 

50 55 60 

Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 

70 75 80 

Asp Phe Glu Gly Pro Gin Gin Gly Tyr Gin Leu Leu Gin Gin Cys Cys 

85 90 95 

Asn Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro Thr Leu Lys 

100 105 110 

Gin Ala Ala Arg Ala Val Ser Leu Gin Gly Gin His Gly Pro Phe Gin 

115 120 125 

Ser Arg Lys He Tyr Gin Ser Ala Lys Tyr Leu Pro Asn He Cys Lys 
130 135 140 

He Gin Gin Val Gly Glu Cys Pro Phe Gin Thr Thr He Pro Phe Phe 

150 155 160 

Pro Pro Tyr Tyr 



<210> 5 
<211> 513 
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<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (510) 

<223> albumine 2S subxmit 2 

<400> 5 

atg gca aac aag etc ttc etc gtc tgc gca act ttc gcc etc tgc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Phe Ala Leu Cys Phe 
1 5 10 15 

etc etc ace aac get tec ate tac cgc act gtt gtc gag ttc gae gaa 96 
Leu Leu 1*hr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gae gee age aac cec atg ggc cca aga cag aaa tgt cag aag gag 144 
Asp Asp Ala Ser Asn Pro Met Gly Pro Arg Gin Lys Cys Gin Lys Glu 
35 40 45 

ttt cag caa tea cag cac eta aga get tgc cag aaa ttg atg cgc atg 192 
Phe Gin Gin Ser Gin His Leu Arg Ala Cys Gin Lys Leu Met Arg Met 
50 55 60 

caa atg agg caa ggc cgt ggt ggt ggt cec tec etc gae gat gag ttc 240 
Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65' 70 75 80 

gat ttg gaa gae gae ate gag aac cca caa ggc cec cag cag gga cac 288 
Asp Leu Glu Asp Asp lie Glu Asn Pro Gin Gly Pro Gin Gin Gly His 

85 90 95 

cag ate etc cag cag tgc tgc age .gag ett cgc cag gaa gag cca gtt 336 
Gin lie Leu Gin Gin Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val 
100 105 110 

tgt gtt tgc cec ace ttg aga caa get gcc agg gcc gtt age etc cag 384 
Cys Val Cys Pro Thr Leu Arg Gin Ala Ala Arg Ala Val Ser Leu Gin 
115 120 125 

gga caa cac gga cca ttc caa tec agg aaa att tac aag aca get aag 432 
Gly Gin His Gly Pro Phe Gin Ser Arg Lys lie Tyr Lys Thr Ala Lys 
130 135 140 

tac ttg cct aac att tgc aag ate cag caa gtt ggt gaa tgc cec ttc 480 
Tyr Leu Pro Asn lie Cys Lys lie Gin Gin Val Gly Glu Cys Pro Phe 
145 150 155 ■ 160 

cag ace ace ate cct ttc ttc cct cct tac taa 513 
Gin Thr Thr lie Pro Phe Phe Pro Pro Tyr 
165 170 

<210> 6 
<211> 170 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 6 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Thr Phe Ala Leu Cys Phe 

1 5 10 15 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala Ser Asn Pro Met Gly Pro Arg Gin Lys Cys Gin Lys Glu 
35 40 45 



BNSTOCIO: <WO 0307e629A1J_> 



wo 03/078629 PCT/EP03/02735 

5 

Plae Gin Gin Ser Gin His Leu Arg Ala Cys Gin Lys Leu Met Arg Met 
50 55 60 

Gin Met Arg Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Plie 

70 75 80 

Asp Leu Glu Asp Asp lie Glu Asn Pro Gin Gly Pro Gin Gin Gly His 

85 90 95 

Gin lie Leu Gin Gin Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val 
100 105 110 

Cys Val Cys Pro Thr Leu Arg Gin Ala Ala Arg Ala Val Ser Leu Gin 
115 120 - 125 

Gly Gin His Gly Pro Phe Gin Ser Arg Lys lie Tyr Lys Thr Ala Lys 
130 135 140 

Tyr Leu Pro Asn lie Cys Lys lie Gin Gin Val Gly Glu Cys Pro Phe 
145 150 155 160 

Gin Thr Thr lie Pro Phe Phe Pro Pro Tyr 
165 170 



<210> 7 
<211> 501 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (498) 

<223> albumine 2S subxinit 4 

<400> 7 

atg gcg aac aag etc ttc etc gtc tgc gca get etc gee ctg tgt' ttc 48 
Met Ala Asn Lys Leu Phe Leu Val Cys Ala Ala Leu Ala Leu Cys Phe 



15 10 



15 



ate etc ace aac get tec gtc tat cgc acc gtt gtc gag ttc gac gaa 96 
lie Leu Thr Asn Ala Ser Val Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gac gee agt aac ccc ata gge cea ata cag aaa tgt cag aag gag 144 
Asp Asp Ala Ser Asn Pro lie Gly Pro He Gin Lys Cys Gin Lys Glu 
35 .40 * 45 • 

ttt cag caa gac cag eac eta aga get tgc cag aga tgg atg cgc aag 192 
Phe Gin Gin Asp Gin His Leu Arg Ala Cys Gin Arg Trp Met Arg Lys 
50 55 60 

caa atg tgg caa gga cgt ggt ggt ggt cct tec etc gac gat gag ttc 240 
Gin Met Trp Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65 70 75 80 

gat atg gaa gac gac ate gag aac ccg cag. aga cga cag eta etc cag 288 
Asp Met Glu Asp Asp He Glu Asn Pro Gin Arg Arg Gin Leu Leu Gin 

85 * 90 95 

•aag tgc tgc age gag ett cgc caa gaa gag cca gtt , tgc gtt tgc ccc 336 
Lys Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro 
100 105 110 

acc ttg aga caa get gee aag gee gtt aga ttc cag gga cag caa eac 3 84 
Thr Leu Arg Gin Ala Ala Lys Ala Val Arg Phe Gin Gly Gin Gin His 
115 120 125 
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caa cca gag caa gtc agg aaa att tac cag gca get aag tac ttg cct 432 
Gin Pro Glu Gin Val Arg Lys He Tyr Gin Ala Ala Lys Tyr Leu Pro 
130 135 140 

aac att tgc aaa ate eag caa gtt ggt gtt tgc ecc ttc cag ate cct 
Asn He Cys Lys He Gin Gin Val Gly Val Cys Pro Phe Gin He Pro 
145 150 155 160 

tea ate cct tet tac tae taa 
Ser He Pro Ser Tyr Tyr 
165 

<210> 8 
<211> 166 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 8 

Met Ala Asn Lys Leu Phe Leu Val Cys Ala Ala Leu Ala Leu Cys Plie 
1 5 10 15 

He Leu Thr Asn Ala Ser Val Tyr Arg Tlor Val Val Glu Phe Asp Glu 
20 25 - " 30 

Asp Asp Ala Ser Asn Pro He Gly Pro He Gin Lys Cys Gin Lys Glu 
35 40 45 

Phe Gin Gin Asp Gin His Leu Arg Ala Cys Gin Arg Trp Met Arg Lys 
50 55 60 

Gin Met Trp Gin Gly Arg Gly Gly Gly Pro Ser Leu Asp Asp Glu Phe 
65 70 75 80 

Asp Met Glu Asp Asp He Glu Asn Pro Gin Arg Arg Gin Leu Leu Gin 

85 90 95 

Lys Cys Cys Ser Glu Leu Arg Gin Glu Glu Pro Val Cys Val Cys Pro 
100 105 110 

Thr Leu Arg Gin Ala Ala Lys Ala Val Arg Phe Gin Gly Gin Gin His 
115 120 125 

Gin Pro Glu Gin Val Arg Lys He Tyr Gin Ala Ala Lys Tyr Leu Pro 
130 135 140 

Asn He Cys Lys He Gin Gin Val Gly Val Cys Pro Phe Gin He Pro 
145 150 155 160 

Ser He Pro Ser Tyr Tyr 

165 



<210> 9 

<211> 1473 

<212> DMA 

<213> Brassica napus 

<220> 

<221> CDS 

.<222> (1) . . (1470) 

<223> cruciferin 



<400> 9 

atg get egg etc tea tet ett etc tet ttt tec tta gea ett ttg ate 48 
Met Ala Arg Leu Ser Ser Leu Leu Ser Phe Ser Leu Ala Leu Leu He 
1 5 10 15 
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ttt etc cat ggc tct aca get caa cag ttt cca aac gag tgt cag eta 96 
Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glii Cys Gin Leu 
20 25. 30 

gac cag etc aat gca ctg' gag ecg tea eac gta ctt aag get gag get 144 
Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

ggt egc ate gag gtg tgg gae eac eac get cct cag eta cgt tgc tct 192 
Gly Arg lie Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

ggt gtc tec ttt gta cgt tac ate ate gag tct aag ggt etc tac ttg 240 
Gly Val Ser Phe Val Arg Tyr He He Glu Ser Lys Gly Leu Tyr Leu 
65 70' 75 80 

ccc tct ttc ttt age acc gcg aag etc tec ttc gtg get aaa gga gaa 288 
Pro Ser Phe Phe Ser Thr Ala Lys Leu Ser Phe Val Ala Lys Gly Glu 

85 90 95 

ggt ctt atg ggg aga gtg gtc cct gga tgc gee gag aca ttc cag gac 336 
Gly Leu Met Gly Arg Val Val Pro Gly Cys Ala Glu Thr Phe Gin Asp 
100 105 110 

tea tea gtg ttt caa cca age ggt ggt age ccc teg gga gaa ggt cag 384 
Ser Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Ser Gly Glu Gly Gin 
115 120 125 

ggc caa gga caa caa ggt cag ggc caa ggc cac caa ggt caa ggc caa 432 
Gly Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin 
130 135 . 140 

gga caa cag ggc caa caa ggt cag caa gga caa cag agt caa ggc cag 480 
Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin 
145 150 155 160 

ggc ttc cgt gat atg eac cag aaa gtg gag cac ata agg act ggg gac 528 
Gly Phe Arg Asp Met His Gin Lys Val Glu His He Arg Thr Gly Asp 

165 170 175 

acc ate get aca cat ccc ggt gta gee caa tgg ttc tac aac gac gga 576 
Thr He Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly 
180 185 190 

aac caa cca ctt gtc ate gtt tec gtc etc gat tta gee age cac cag 624 
Asn Gin Pro Leu Val He Val Ser Val Leu Asp Leu Ala Ser His Gin 
195 200 205 

aat cag etc gac egc aac cca agg cca ttt tac tta gee gga aac aac 672 
Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn 
210 215 220 

cca caa ggc caa gta tgg ata gaa gga egc gag caa cag cca caa. aag 720 
Pro Gin Gly Gin Val Trp He Glu Gly Arg Glu Gin Gin Pro Gin Lys 
225 230 235 240 

aac ate ctt aat ggc ttc aca cca gag gtt ctt get aaa get ttc aag 7 68 
Asn He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys 

245 250 255 

ate gat gtt agg aca gcg caa caa ctt cag aac cag caa gac aac cgt 816 
He Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg 
260 265 270 

gga aac att ate ega gtc caa ggc cca ttc agt gtc att agg ecg cct 864 
Gly Asn He He Arg Val Gin Gly Pro Phe Ser Val He Arg Pro Pro 
275 280 285 
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ttg agg agt cag aga ccg cag gag aca gaa gtt aac ggt tta gaa gag 912 
Leu Arg Ser Gin Arg Pro Gin Glu Thr Glu Val Asn Gly Leu Glu Glu 
290 295 300 

acc ata tgc age gcg agg tgc acc gat aac etc gat gac cca tot aat 960 
Thx lie Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Asn 
305 310 315 320 

get gac gta tac aag cca cag etc ggt tac ate age act ctg aac age 1008 
Ala Asp Val Tyr Lys Pro Gin Leu Gly Tyr lie Ser Thr Leu Asn Ser 
325 330 335 

tat gat etc cec ate ett cgc ttc ctt cgt etc tea gee etc egt gga 1056 
. Ty^r Asp Leu Pro lie Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly 
340 345 350 

tct ate cgt caa aac gcg atg gtg ctt cca cag tgg aac gea aac gca 1104 
Ser lie Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala 
355 360 365 

aac gcg gtt etc tac gtg aca gac ggg gaa gcc cat gtg cag gtg gtt 1152 
Asn Ala Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val Val 
370 375 380 

aac gac aac ggt gac aga gtg "ttc gac gga caa gtc tct caa gga cag 1200 
Asn Asp Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin 
385 390 395 400 

eta ctt tec ata cca caa ggt ttc tec gtg gtg aaa cgc gea aca age 1248 
Leu Leu Ser lie Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser 
405 410 415 

gaa cag ttc egg tgg ate gag ttc aag aca aac gca aac gea cag ate 1296 
Glu Gin Phe Arg Trp lie Glu Phe Lys Thr Asn Ala Asn Ala Gin lie 
420 425 430 

aac aca ctt get gga ega acc teg gtc ttg aga ggt tta cca tta gag 1344 
Asn Thr Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu 
435 440 445 

gtc ata tec aat ggg tac caa ate tea etc gaa gaa gea aga agg gtt 1392 
Val He Ser Asn Gly Tyr Gin He Ser Leu Glu Glu Ala Arg Arg Val 
450 455 .460 

aag ttc aac acg ate gag acc act ttg acg cac age agt ggc cca get 1440 
Lys Phe Asn Thr He Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala 
465 470 475 480 

age tac gga ggg cca agg aag get gat get taa 1473 
Ser Tyr Gly Gly Pro Arg Lys Ala Asp Ala 
485 490 

<210> 10 
<211> 490 
<212> PRT 

<213> Brass ica napus 
<400> 10 

Met Ala TVrg Leu Ser Ser Leu Leu Ser Phe Ser Leu Ala Leu Leu He 
15 10 15 

Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25 30 

Asp Gin Leu Asn 7Q.a Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 
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Gly Arg lie Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

Gly Val Ser Phe Val Arg Tyr lie lie Glu Ser Lys Gly Leu Tyr Leu 

70 75 80 

Pro Ser Phe Phe Ser Thr Ala Lys Leu Ser Phe Val Ala Lys Gly Glu 

85 90 95 

Gly Leu. Met Gly Arg Val Val Pro Gly Cys Ala Glu Thr Phe Gin Asp 
100 105 110. 

Ser Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Ser Gly Glu Gly Gin 
115 120 125 

Gly Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin 
130 135 140 

Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin 
145 150 155 160 

Gly Phe Arg Asp Met His Gin Lys Val Glu His lie Arg Thr Gly Asp 
165 170 175 

Thr He Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly 
180 185 190 

Asn Gin Pro Leu Val He Val Ser Val Leu Asp Leu Ala Ser His Gin 
195 200 205 

Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn 

210 215 220 

Pro Gin Gly Gin Val Trp He Glu Gly Arg Glu Gin Gin Pro Gin Lys 
225 230 235 240 

Asn He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys 

245 250 255 

He Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg 
260 . 265 270 

Gly Asn He He Arg Val Gin Gly Pro Phe Ser Val He Arg Pro Pro 
275 280 285 

Leu Arg Ser Gin Arg Pro Gin Glu Thr Glu Val Asn Gly Leu Glu Glu 
290 295 300 

Thr He Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Asn 
305 310 315 320 

Ala Asp Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser 
325 330 335 

Tyr Asp Leu Pro He Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly 
340 345 350 

Ser He Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala 

355 360 365 

Asn Ala Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val Val 
370 375 380 

Asn Asp Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin 
385 390 395 400 

Leu Leu Ser He Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser 

405 410 415 

Glu Gin Phe Arg Trp He Glu Phe Lys Thr Asn Ala Asn Ala Gin He 
420 425 430 
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Asn Thr Leu Ala Gly Arg Thx Ser Val Leu Arg Gly Leu Pro Leu Glu 
435 440 445 

Val lie Ser Asn Gly Tyr Gin He Ser Leu Glu Glu Ala Arg Arg Val 
450 455 460 

Lys Phe Asn "Thr He Glu Thr Thr Leu Tlir His Ser Ser Gly Pro Ala 
465 470 475 480 

Ser Tyr Gly Gly Pro Arg Lys Ala Asp Ala 
485 490 



<210> 11 
<211> 1467 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (1) . . (1464) 

<223> cruciferin 

<400> 11 

atg get egg cte tea tct ctt etc tet ttt tee tta gea ctt ttg act 48 

Met Ala Arg Leu Ser Ser Leu Leu Ser Phe Ser Leu Ala Leu Leu Thx 
15 10 15 

ttt etc cat ggc tct aca get caa cag ttt cca aac gag tgt cag eta 96 
Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25 30 

gac eag etc aat gca ctg gag eeg tea cac gta ctt aag get gag get 144 
Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

ggt ege ate gag gtg tgg gac cac cac get cet cag eta egt tge tct 192 
Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 

50 55 * 60 

ggt gtc tec ttt gta egt tac ate ate gag tct aag ggt etc tac ttg 240 
Gly Val Ser Phe Val Arg Tyr He He Glu Ser Lys Gly Leu Tyr Leu 
65 .70 75 . 80 

cec tct ttc ttt age ace gcg agg etc tec tte gtg get ^aa gga gaa 288 
Pro Ser Phe Phe Ser Thr Ala Arg Leu Ser Phe Val Ala Lys Gly Glu 

85 90 95 

ggt ctt atg ggg aga gtg gtc ctg tgc gcc gag aca ttc cag gac tea 336 
Gly Leu Met Gly Arg Val Val Leu Cys Ala Glu Thr Phe Gin Asp Ser 
100 105 110 

tea gtg ttt caa cca age ggt ggt age cec ttc gga gaa ggt cag ggc 384 
Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Phe Gly Glu Gly Gin Gly 
115 120 125 

caa gga caa caa ggt cag ggc caa ggc cac caa ggt caa ggc caa gga 432 
Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin Gly 

130 135 140 

caa eag ggc caa caa ggt cag caa gga caa cag agt caa ggc cag ggt 480 
Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin Gly 
145 150 155 160 

ttc egt gat atg cac cag aaa gtg gag cac ata agg act ggg gac acc 52 8 
Phe Arg Asp Met His Gin Lys Val Glu His He Arg Thr Gly Asp Thr 
165 170 175 
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ate get aca cat ccc ggt gta gcc caa tgg ttc tac aac gac gga aac 576 
lie Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly Asn 
180 185 190 

caa cca ctt gtc ate gtt tec gtc etc gat tta gcc age cae cag aat 624 
Gin Pro Leu Val lie Val Ser Val Leu Asp Leu Ala Ser His Gin Asn 
195 200 205 

cag etc gac cgc aac cca agg cca ttt tac tta gcc gga aac aac cca 672 
Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn Pro 
210 215 220 

caa ggc caa gta tgg ata gaa gga cgc gag caa cag cca caa aag aac 720 
Gin Gly Gin Val Trp lie Glu Gly Arg Glu Gin Gin Pro Gin Lys Asn 
225 230 235 240 

ate ctt aat ggc ttc aca cca gag gtt ctt get aaa get ttc aag ate 768 
He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys He 
245 250 255 

gat gtt agg aca geg caa caa ctt cag aac cag caa gac aac cgt gga 816 
Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin -Gin Asp Asn Arg Gly 
260 265 270 

aac att ate ega gtc caa ggc cca ttc agt gtc att agg ccg cct ttg 864 
Asn He He Arg Val Gin Gly Pro Phe Ser Val He Arg Pro Pro Leu 
275 280 285 

agg agt cag aga ccg cag gag gaa gtt aac ggt tta gaa gag acc ata 912 
Arg Ser Gin Arg Pro Gin Glu Glu Val Asn Gly Leu Glu Glu Thr He 
290 295 300 

tgc age geg agg tgc acc gat aac etc gat gac cca tet aat get gac 960 
Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Asn Ala Asp 
305 310 315 320 

gta tac aag cca cag etc ggt tac ate age act etg aac age tat gat 1008 
Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 

325 330 335 

etc ccc ate ctt cgc ttc ctt cgt etc tea gee etc cgt gga tet ate 1056 
Leu Pro He Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser He 

340 345 350 

cgt caa aac geg atg gtg ctt cca cag tgg aac gca aac gea aac geg 1104 
Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
355 360 365 

gtt etc tac gtg aca gac ggg gaa gee cat gtg cag gtg gtt aac gac 1152 
Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val Val Asn Asp 
370 375 380 

aac ggt gac aga gtg- ttc gac gga caa gtc tet caa gga cag eta ctt 1200 
Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu Leu 
385 390 395 400 

tec ata cca caa ggt ttc tec gtg gtg aaa cgc gca aca age gaa cag 1248 
Ser He Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Glu Gin 
405 410 415 

ttc egg tgg ate gag ttc aag aca aac gea aac gca cag ate aac aca 1296 
•Phe Arg Trp He Glu Phe Lys Thr Asn Ala Asn Ala Gin He Asn Thr 

420 425 430 

ctt get gga cga ace teg gtc ttg aga ggt tta cca tta gag gtc ata 1344 
Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 
435 440 445 
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tec aat ggg tac caa ate tea cte gaa gaa gca aga agg gtt aag ttc 1392 
Ser Asn Gly Tyr Gin lie Ser Leu Glu Glu Ala Arg Arg Val Lys Phe 
450 455 460 

aac.acg ate gag aec aet ttg acg eac age agt gge cea get age tac 1440 
Asn Tlir lie Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
465 470 475 480 

gga ggg cca agg aag get gat get taa' 1467 
Gly Gly Pro Arg Lys Ala Asp Ala 
485 

<210> 12 
<211> 488 
<212> PRT 
• <213> Brassica napus 

<4D0> 12 

Met Ala Arg Leu Ser Ser Leu Leu Ser Phe Ser Leu Ala Leu Leu Thr 
1 5 10 15 ■ 

Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys . Gin Leu 
20 25 30 

Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

Gly Arg lie Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser * 
50 55 60 

Gly Val Ser Phe Val Arg Tyr He He Glu Ser Lys Gly Leu Tyr Leu 
65 70 75 80 

Pro Ser Phe Phe Ser Thr Ala Arg Leu Ser Phe Val Ala Lys Gly Glu 

85 '90 95 

Gly Leu Met Gly Arg Val Val Leu Cys Ala Glu Thr Phe Gin Asp Ser 
100 105 110 

Ser Val Phe Gin Pro Ser Gly Gly Ser Pro Phe Gly Glu Gly Gin Gly 
115 120 125 

Gin Gly Gin Gin Gly Gin Gly Gin Gly His Gin Gly Gin Gly Gin Gly 
130 135 140 

Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Ser Gin Gly Gin Gly 
145 150 155 160 

Phe Arg Asp Met His Gin Lys Val Glu His He Arg Thr Gly Asp Thr 
165 170 175 

He Ala Thr His Pro Gly Val Ala Gin Trp Phe Tyr Asn Asp Gly Asn 
180 185 190 

Gin Pro Leu Val He Val Ser Val Leu Asp Leu Ala Ser His Gin Asn 
195 200 205 

Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr Leu Ala Gly Asn Asn Pro 
210 215 220 

Gin Gly Gin Val Trp He Glu Gly Arg Glu Gin Gin Pro Gin Lys Asn 
225 230 235 240 

He Leu Asn Gly Phe Thr Pro Glu Val Leu Ala Lys Ala Phe Lys He 
245 250 255 

Asp Val Arg Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg Gly 
260 265 270 
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Asn lie lie Arg Val Gin Gly Pro Phe Ser Val lie Arg Pro Pro Leu 
275 280 285 

Arg Ser Gin Arg Pro Gin Glu Glu Val Asn Gly Leu Glu Glu Thr He 
290 295 . 300 

Cys Ser Ala Arg Cys Tlir Asp Asn Leu Asp Asp • Pro Ser Asn Ala 'Asp 
305 310 315 320 

Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 

325 330 335 

Leu Pro He Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser He 
340 345 350 

Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 

355 360 365 

Val Leu Tyr Val Thr Asp Gly Glu Ala His Val Gin Val. Val Asn Asp 
370 375 380 

Asn Gly Asp Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu Leu 
385 390 395 400 

Ser He Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Glu Gin 

405 410 415 

Phe Arg Trp He Glu Phe Lys Thr Asn Ala Asn Ala Gin He Asn Thr 
420 425 430 

Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 
435 440 445 

Ser Asn Gly Tyr Gin He Ser Leu Glu Glu Ala Arg Arg Val Lys Phe 

450 455 460 

Asn Thr He Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
465 470 475 480 

Gly Gly Pro Arg Lys Ala Asp Ala 

485 



<210> 13 
<211> 1491 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (1) . . (1488) 

<223> cruciferin BnC2 

<400> 13 

atg get cga etc teg tct ctt cte tat ttt teg ata aca gtt ttg ate 48 

Met Ala Arg Leu Ser Ser Leu Leu Tyr Phe Ser He Thr Val Leu He 

15 10 15 

ttt ete cat gge tct aca get caa eag ttt eca aac gag tgc caa eta 96 

Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 

20 25 30 

gae eag etc aat geg ctg gag ceg tea eac gta ctt aag gee gag get 144 
Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

ggt cgc ate gaa gtg tgg gae cae eac get cet eag eta cgc tgc tct 192 
Gly Arg He Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 
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ggt gtc tec 
Gly Val Ser 
65 

ccc tct ttc 
Pro Ser Plie 

ggc ctt atg 
Gly Leu Met 

tea tea gta 
Ser Ser Val 
115 

ggc caa ggt 
Gly Gin Gly 
. 130 

aag ggc caa 
Lys Gly Gin 
145 

caa cag ggt 
Gin Gin Gly 

eac ata agg 
His lie Arg 

tgg ttc tae 
Trp Phe Tyr 
195 

gat. tta get 
Asp Leu Ala 
210 

tac tta gca 
Tyr Leu Ala 
225 

ggg caa cag 
Gly Gin Gin 

ctt get caa 
Leu Ala Gin 

aac cag caa 
Asn Gin Gin 
275 

ggt gtt att 
Gly Val lie 
290 

get aac ggt 
Ala Asn Gly 
305 

etc gat gae 
Leu Asp Asp 



ttc gta egt tac 
Phe Val Arg Tyr 
70 

tta aat acc gcg 
Leu Asn Thr Ala 
85 

ggg aga gtg gtc 
Gly Arg Val Val 
100 

ttc caa cea ggc 
Phe Gin Pro Gly 

cag cag ggt cag 
Gin Gin Gly Gin 
135 

cag ggt caa ggc 
Gin Gly Gin Gly 
150 

caa ggt caa ggt 
Gin Gly Gin Gly 
165 

age ggc gac acc 
Ser Gly Asp Thr 
180 

aac aat gga aac 
Asn Asn Gly Asn 

age cac cag aac 
Ser His Gin Asn 
215 

gga aaa aac cea 
Gly Lys Asn Pro 
230 

cea caa aac aac 
Pro Gin Asn Asn 
245 

gcg ttc aag ate 
Ala Phe Lys lie 
260 

gat aac egg gga 
Asp Asn Arg Gly 

agg ccg cea ttg 
Arg Pro Pro Leu 

295 

eta gaa gag ace 
Leu Glu Glu Thr 
' 310 

cea tct aac gcg 
Pro Ser Asn Ala 
325 



ata ate gag 
lie lie Glu 

aac gtc tct 
Asn Val Ser 
90 

ect gga tge 
Pro Gly Cys 
105 

agt ggc age 
Ser Gly Ser 
120 

ggg caa ggt 
Gly Gin Gly 

aag ggc caa 
Lys Gly Gin 

ttc egt gat 
Phe Arg Asp 
170 

att get aea 
lie Ala Thr 
185 

caa ect ctt 
Gin Pro Leu 
200 

cag ctt* gac 
Gin Leu Asp 

caa ggc caa 
Gin Gly Gin 

ate ctt aat 
lie Leu Asn 
250 

gat gtt agg 
Asp Val Arg 
265 

aac att gtc 
Asn He Val 
280 

aaa age cag 
Lys Ser Gin 

ata tgc age 
He Cys Ser 

gat gtg tat 
Asp Val Tyr 
330 



14 

tct cag ggt eta 
Ser Gin Gly Leu 
75 

ttc gtt get aaa 
Phe Val Ala Lys 

get gag act ttc 
Ala Glu Thr Phe 
110 

ccc ttc gga gaa 
Pro Phe Gly Glu 

125 

cag ggt cag ggt 
Gin Gly Gin Gly 

140 

cag ggt caa tec 
Gin Gly Gin Ser 
155 

atg cac cag aaa 
Met His Gin Lys 

cat ccc ggt gta 
His Pro Gly Val 
190 

gtc ate gtt gee 
Val lie Val Ala 
205 

ege aac cea age 
Arg Asn Pro Ser 
220 

tea tgg eta cac 
Ser Trp Leu His 
235 

ggc ttc tct cea 
Gly Phe Ser Pro 

aea gcg caa caa 
Thr Ala Gin Gin 
270 

egt gtc caa ggc 
Arg Val Gin Gly 
285 

aga cea cag gag 
Arg Pro Gin Glu 

300 

gca agg tge aeg 
Ala Arg Cys Thr 
315 

aag eca cag ctt 
Lys Pro Gin Leu 



tac ttg 240 
Tyr Leu 
80 

gga caa 288 
Gly Gin 
95 

cag gac 336 
Gin Asp 

ggt caa 384 
Gly Gin 

caa ggc 432 
Gin Gly 

cag ggc 480 
Gin Gly 
160 

gta gag 528 

Val Glu 

175 

get caa • 576 
Ala Gin 



gtc atg 624 
Val Met 



caa ttt 672 
Gin Phe 

gga ega 720 
Gly Arg 
240 

gag gtt 768 

Glu Val 

255 

ctt cag 816 
Leu Gin 

ccc ttc 864 
Pro Phe 



aea gaa 912 
Thr Glu 

gat aac 9 60 
Asp Asn 
320 

ggt tac 1008 

Gly Tyr 

335 
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ate age att ett aac agt tat gat eta ecc ate ett cgc gta ctt cgc 1056 
lie Ser lie Leu Asn Ser Tyr Asp Leu Pro lie Leu Axg Val Leu Arg 
340 345 350 

etc tea gcc etc cgt gga tea ate egt caa aat gea atg gtt ctt cca 1104 
Leu Ser Ala Leu Arg Gly Ser lie Arg Gin Asn Ala Met Val Leu Pro 
355 360 365 

eag tgg aag tea aag tea aac gcg gtt etc tae gtg aea gae ggg gaa 1152 
Gin Trrp Lys Ser Lys Ser Asn Ala Val Leu Tyr Val Tiir Asp Gly Glu 
370 375 380 

gcc caa ata cag gtg gtt aac gac aac ggt gac aga gtg ttc gat gga 1200 
Ala Gin lie Gin Val Val Asn Asp Asn Gly Asp Arg Val Phe Asp Gly 

385 390 395 400 

caa gtc tet caa ggg eag eta ett tee att eea caa gga ttc tec gtt 1248 
Gin Val Ser Gin Gly Gin Leu Leu Ser lie Pro Gin Gly Plie Ser Val 
405 410 415 

gtg aaa cgc gca aca age gat cag ttc agg tgg ata gaa ttc aag aca 1296 
Val Lys Arg Ala Thir Ser Asp Gin Phe Arg Trp lie Glu Phe Lys Thr 
420 425 430 

aac gca aac gcc cag ate aac act ctt get gga cgt ace tea gtc atg 1344 
Asn Ala Asn Ala Gin lie Asn Thr Leu Ala Gly Arg Thr Ser Val Met 
435 440 445 

aga ggt tta cca tta gag gtc ata gee aat ggg tae caa ate tea ctt 1392 
Arg Gly Leu Pro Leu Glu Val lie Ala Asn Gly Tyr Gin lie Ser Leu 
450 455 460 

gaa gaa gca aga agg gtt aag ttc aac aca ata gag acc act ttg acc 1440 
Glu Glu Ala Arg Arg Val Lys Phe Asn Thr lie Glu Thr Thr Leu Thr 

465 470 475 480 

cac agt agt ggc cca gcg age tac gga agg cca agg aag get gat get 1488 
His Ser Ser Gly Pro Ala Ser Tyr Gly Arg Pro Arg Lys Ala Asp Ala 
485 490 495 

tga 1491 

<210> 14 
<211> 496 
<212> PRT 

<213> Brassica napus 
<400> 14 

Met Ala Arg Leu Ser Ser Leu Leu Tyr Phe Ser lie Thr Val Leu lie 
1 5 10 .15 

Phe Leu His Gly Ser Thr Ala Gin Gin Phe Pro Asn Glu Cys Gin Leu 
20 25 30 

Asp Gin Leu Asn Ala Leu Glu Pro Ser His Val Leu Lys Ala Glu Ala 
35 40 45 

Gly Arg lie Glu Val Trp Asp His His Ala Pro Gin Leu Arg Cys Ser 
50 55 60 

Gly Val Ser Phe Val Arg Tyr lie lie Glu Ser Gin Gly Leu Tyr Leu 
65 70 75 80 

Pro Ser Phe Leu Asn Thr Ala Asn Val Ser Phe Val Ala Lys Gly Gin 

85 90 95 

Gly Leu Met Gly Arg Val Val Pro Gly Cys Ala Glu Thr Phe Gin Asp 
100 105 110 
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Ser Ser Val Phe Gin Pro Gly Ser Gly Ser Pro Phe Gly Glu Gly Gin 
115 120 125 

Gly Gin Gly Gin Gin Gly Gin Gly Gin Gly Gin Gly Gin Gly Gin Gly 
130 135 140 

Lys Gly Gin Gin Gly Gin Gly Lys Gly Gin Gin Gly Gin Ser Gin Gly 
145 150 155 160 

Gin Gin Gly Gin Gly Gin Gly Phe Arg Asp Met His Gin Lys Val Glu 
165 170 175 

His lie Arg Ser Gly Asp Tlir lie Ala Thr His Pro Gly Val Ala Gin 
180 185 190 

Trp Plie Tyr Asn Asn Gly Asn Gin Pro Leu Val lie Val Ala Val Met 
195 200 205 

Asp Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Ser Gin Phe 

210 215 220 

Tyr Leu Ala Gly Lys Asn Pro Gin Gly Gin Ser Trp Leu His Gly Arg 
225 230 235 240 

Gly Gin Gin Pro Gin Asn Asn lie Leu Asn Gly Phe Ser Pro Glu Val 

245 250 255 

Leu Ala Gin Ala Phe Lys lie Asp Val Arg Thr Ala Gin Gin Leu Gin 
260 265 270 

Asn Gin Gin Asp Asn Arg Gly Asn lie Val Arg Val Gin Gly Pro Phe 

275 280 285 

Gly Val lie Arg Pro Pro Leu Lys Ser Gin Arg Pro Gin Glu Thr Glu 
.290 295 300 

Ala Asn Gly Leu Glu Glu Thr He Cys Ser Ala Arg Cys Thr Asp Asn 
305 310 315 320 

Leu Asp Asp Pro Ser Asn Ala Asp Val Tyr Lys Pro Gin Leu Gly Tyr 
325 330 335 

He Ser He Leu Asn Ser Tyr Asp Leu Pro He Leu Arg Val Leu Arg 
3.40 345 350 

Leu Ser Ala Leu Arg Gly Ser He Arg Gin Asn Ala Met Val Leu Pro 
355 360 365 

Gin Trp Lys Ser Lys Ser Asn Ala Val Leu Tyr Val Thr Asp Gly Glu 
370 375 380 

Ala Gin He Gin Val Val Asn Asp Asn Gly Asp Arg Val Phe Asp Gly 
385 390 395 400 

Gin Val Ser Gin Gly Gin Leu Leu Ser He Pro Gin Gly Phe Ser Val 
405 410 415 

Val Lys Arg Ala Thr Ser Asp Gin Phe Arg Txp He Glu Phe Lys Thr 

420 425* 430 

Asn Ala Asn Ala Gin He Asn Thr Leu Ala Gly Arg Thr Ser Val Met 
435 440 445 

Arg Gly Leu Pro Leu Glu Val He Ala Asn Gly Tyr Gin He Ser Leu 
450 455 460 

Glu Glu Ala Arg Arg Val Lys Phe Asn Thr He Glu Thr Thr Leu Thr 
465 470 475 480 

His Ser Ser Gly Pro Ala Ser Tyr Gly Arg Pro Arg Lys Ala Asp Ala 
485 490 495 
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<210> 15 

<211> 555 
<212> DNA 

<213> Brass ica napus 

<220> 

<221> CDS 

<222> (1) . . (552) 

<223> cruciferin cru4 

<400> 15 

ttg tgc aca atg aga tgc acc gaa aac ctt gat gac ccg tea agt get 48 . 
Leu Cys Thr Met Arg Cys Thr Glu Asn Leu Asp Asp Pro Ser Ser Ala 

15 10 15 

gat gtc tac aag oca teg etc gga tac att age aca etc aae age tae 96 
Asp Val Tyr Lys Pro Ser Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr 
20 25 30 

aac etc cet ate etc aga tte etc ege ctt age get ctt cgt gge tec 144 
Asn Leu Pro He Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser 
35 40 45 

ate cat aae aac get atg gtg etg ceg caa tgg aac gtg aae gea aac 192 
He His Asn Asn Ala Met Val Leu Pro Gin Trp Asn Val Asn Ala Asn 
50 55 . 60 

gcg gea etc tac gtg aca aag ggg aag get cat ata cag atg gtg aae 240 
Ala Ala Leu Tyr Val Thx Lys Gly Lys Ala His He Gin Met Val Asn 
65 70 -75 80 

gac aac gga caa aga gtg ttt gac caa gag ate tec cag gga cag tta 288 
Asp Asn Gly Gin Arg Val Phe Asp Gin Glu He Ser Gin Gly Gin Leu 

85 90 95 

ctt gtc gtg cea caa gge tte gcg gtc gtg aaa cgt gee aca age caa 33 6 
Leu Val Val Pro Gin Gly Phe Ala Val Val Lys Arg Ala Thr Ser Gin 

100 105 110 

cag tte cag tgg ate gag tte aag age aac gac aac gea cag ate aac 384 
Gin Phe Gin Trp He Glu Phe Lys Ser Asn Asp Asn Ala Gin He Asn 
115 .120 125 

aca etc gcg gga ege ace tea gtc atg aga ggt tta cea ctt gag gtt 432 
Thr Leu Ala Gly Arg Thr Ser Val Met Arg Gly Leu Pro Leu Glu Val 
130 135 * 140 

ata tec aac ggg tat cag ate tea cec caa gaa get aga agt gtt aag 480 
He Seir Asn Gly Tyr Gin He Ser Pro Gin Glu Ala Arg Ser Val Lys 
145 150 155 160 

tte age act ctt gag acc aca ttg act caa age agt ggt cet atg gge 528 
Phe Ser Thr Leu Glu Thr Thr Leu Thr Gin Ser Ser Gly Pro Met Gly 
165 170 175 

tac ggt atg cet aga gtc gag get tga 555 
Tyr Gly Met Pro Arg Val Glu Ala 
180 

<210> 16 ' 
<211> 184 
<212> PRT 

<213> Brassica napus 
<400>' 16 

Leu Cys Thr Met Arg Cys Thr Glu Asn Leu Asp Asp Pro Ser Ser Ala 

15 10 15 " 
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. Asp Val Tyr Lys Pro Ser Leu Gly Tyr He Ser Thr Leu Asn Sex Tyr 
20 25 30 

Asn Leu Pro He Leu Arg Phe Leu Arg Leu Ser Ala Leu Arg Gly Ser 

35 40 45 

He His Asn Asn Ala Met Val Leu Pro Gin Trp Asn Val Asn Ala Asn 
50 ■ 55 60 

Ala Ala Leu Tyr Val Thr Lys Gly Lys Ala His He Gin Met Val Asn 
65 70 75 80 

Asp Asn Gly Gin Arg Val Phe Asp Gin Glu He Ser Gin Gly Gin Leu 

85 90 95 

Leu Val Val Pro Gin Gly Phe Ala Val Val Lys Arg Ala Thr Ser Gin 
100 105 110 

Gin Phe Gin Trp He Glu Phe Lys Ser Asn Asp Asn Ala Gin He Asn 
115 120 125 

Thr Leu Ala Gly Arg Thr Ser Val Met Arg Gly Leu Pro Leu Glu Val * 
130 135 140 

He Ser Asn Gly Tyr Gin He Ser Pro Gin Glu Ala Arg Ser Val Lys 
145 150 155 160 

Phe Ser Thr Leu Glu Thr Thr Leu Thr Gin Ser Ser Gly Pro Met Gly 
165 170 175 

Tyr Gly Met Pro Arg Val Glu Ala 
180 

<210> 17 
<211> 1530 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (1) . . (1527) 

<223> cruciferin cru4 

<400> 17 

atg gtt aaa gtt cct cat etc etc gtc gca acg ttc ggg gtt etc etc 48 
Met Val Lys Val Pro His Leu Leu Val Ala Thr Phe Gly Val Leu Leu 
1 • 5 10 15 

gtc etc aac gge tgt etc gca agg cag teg eta ggg gtt cct cct cag 96 
Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 
20 25 30 

eta ggg aac gcg tgt aac etc gat aac tta gac gtt etc cag cct ace 144 
Leu Gly Asn Ala Cys Asn Leu Asp Asn Leu Asp' Val Leu Gin Pro Thr 
35 40 45 

gaa act ate aag age gag get ggt egg gtc gag tac tgg gat eac aac 192 
Glu Thr He Lys Ser Glu Ala Gly Arg Val Glu Tyr Trp Asp His Asn 
50 55 60 

aat cct cag ate cga tgt get ggt gtc tet gtc tct egt gtt ata ate 240 
Asn Pro Gin He Arg Cys Ala Gly Val Ser Val Ser Arg Val He He 
65 70 75 80 

gaa caa gge ggt etc tac ctt cct ace ttc ttc age tec cec aaa att 288 
Glu Gin Gly Gly Leu Tyr Leu Pro Thr Phe Phe Ser Ser Pro Lys He 

85 90 95 
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tea tac gtt gtt caa gga atg ggt att age gga aga gtg gtc cct gga 33 6 
Ser Tyr Val Val Gin Gly Met Gly He Ser Gly Arg Val Val Pro Gly 
100 105 110 

tgc gcg gaa acc ttc atg gac teg cag cct atg caa gga caa caa caa 3 84 
Cys Ala Glu Thr Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 
115 120 125 

ggt caa cca tgg cag gga caa caa gga caa cag ggt cag cag gga caa 432 
Gly Gin Pro.Trp Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin 
130 135 140 

caa ggt caa cag ggt cag cag gga caa caa ggt caa cag ggt cag cag 480 
Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin 
145 150 155 160 

ggt caa cag gga cag cag ggt cag cag cag caa ggg ttc cgt gac atg 528 
Gly Gin Gin Gly Gin Gin Gly Gin Gin Gin Gin Gly Phe Arg Asp Met 

165 170 175 

cac cag aag gtc gaa cat gtt cga cat gga gac ate att gee att act 576 
His Gin Lys Val Glu His Val Arg His Gly Asp He He Ala He Thr 
180 185 190 

gca ggc tet tec cat tgg ate tac aac acc ggt gac cag cca ctt gtc 624 
Ala Gly Ser Ser His Trp He Tyr Asn Thr Gly Asp Gin Pro Leu Val 
195 200 205 

att ate tgc ctt etc gac att gee aac tac caa aac caa etc gac cgc 672 
He He Cys Leu Leu Asp He Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
210 215 220 

aac cca aga aeg ttc cgt ctg gee gga aac aac cca cag ggc ggt tec 720 
Asn Pro Arg Tlor Plie Arg Leu Ala Gly Asn Asn Pro Gin Gly Gly Ser 
225 230 235 .240 

cag cag cag cag caa caa caa cag aac atg ttg age ggg ttc gac cct 7 68 
Gin Gin Gin Gin Gin Gin Gin Gin Asn Met Leu Ser Gly Phe Asp Pro 

245 250 255 

cag gtc eta gee cag gca ttg aaa ate gac gtt agg ttg get cag gag 816 
Gin Val Leu Ala Gin Ala Leu Lys He Asp Val Arg Leu Ala Gin Glu 
260 265 270 

ctt cag aac caa caa gac age aga gga aac ate gtt cgt gtt aag gga 864 
Leu Gin Asn Glh Gin Asp Ser Arg Gly Asn He Val Arg Val Lys Gly 
275 280 285 

cct ttc cag gtt gtg agg ccg cct ctt aga cag cca tac gag agt gag 912 
Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu Ser Glu 
290 295 300 

cag tgg aga cac ccc cgt ggc cca cca caa age cca caa gac aac ggc 960 
Gin Trp Arg His Pro Arg Gly Pro Pro Gin Ser Pro Gin Asp Asn Gly 
305 310 315 320 

ttg gag gag act ate tgc age atg agg acc cac gag aac att gat gac 1008 
Leu Glu Glu Thx He Cys Ser Met Arg Thr His Glu Asn He Asp Asp 

325 330 335 

cca gee cgt get gac gtg tat aag ccc aac etc ggc cgt gtg act age 1056 
Pro Ala Arg Ala Asp Val Tyr Lys Pro Asn Leu Gly Arg Val Thr Ser 
340 345 350 

gtc aac age tac act tta ccc ate ttg cag tat ate aga etc age gee 1104 
Val Asn Ser Tyr Thr Leu Pro He Leu Gin Tyr He Arg Leu Ser Ala 
355 360 365 
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acc cgt ggc att etc cag ggt aat gcg atg gtg ctt ccg aaa tac aac 1152 
TtLr Arg Gly lie Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn 
370 375 380 

atg aac gcg aac gag ate ttg tac tgc act caa gga caa gca agg att 1200 
Met Asn Ala Asn Glu lie Leu Tyr Cys Tlir Gin Gly Gin Ala Arg lie 
385 390 395 400 

caa gtg gtg aac gac aac gga cag aac gtg ctg gac cag cag gtg cag 1248 
Gin Val Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin 
405 410 415 

aag gga cag etc gtg gtc ate cea caa gga ttc gee tat gtt gte cag 1296 
Lys Gly Gin Leu Val Val lie Pro Gin Gly Phe Ala Tyr Val Val Gin 
420 425 430 

tee cac caa aac aac ttc gaa tgg att tet ttc aag aca aac get aac 1344 
Ser His Gin Asn Asn Phe Glu Trp lie Ser Plie Lys Thr Asn Ala Asn 
435 440 445 

gcg atg gtc age act ttg gee ggt aga ace teg gee ttg agg gca ttg 1392 
Ala Met Val Ser Thr Leu Ala Gly Arg THr Ser Ala Leu Arg Ala Leu 
450 455 460 

cea eta gag gtc ata acc aac get ttc caa att tet etc gag gaa get 1440 
Pro Leu Glu Val lie Thr Asn Ala Phe Gin lie Ser Leu Glu Glu Ala 
465 470 475 480 

aga agg ate aag ttc aac acg ctt gag acc act ttg act cgt gcg cge 1488 
Arg Arg lie Lys Phe Asn Thr Leu Glu Thr Thr Leu Thr Arg Ala Arg 
485 490 495 

ggt gga caa ece cag ttg ate gag gag ata gtc gag get taa 1530 
Gly Gly Gin Pro Gin Leu lie Glu Glu lie Val Glu Ala 
500 505 

<210> 18 
<211> 509 
<212> PRT 

<213> Brass ica napus 
<400> 18 

Met Val Lys Val Pro His Leu Leu Val Ala Thr Phe Gly Val Leu Leu 
1 5 ♦ 10 15 

Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 
20 25 30 

Leu Gly Asn Ala Cys Asn Leu Asp Asn Leu Asp Val Leu Gin Pro Thr 
35 40 45 

Glu Thr lie Lys Ser Glu Ala Gly Arg Val Glu Tyr Trp Asp His Asn 
50 55 60 

Asn Pro Gin lie Arg Cys Ala Gly Val Ser Val Ser Arg Val lie lie 
65 70 75 80 

Glu Gin Gly Gly Leu Tyr Leu Pro Thr Phe Phe Ser Ser Pro Lys lie 

85 90 95 

Ser Tyr Val Val Gin Gly Met Gly He Ser Gly Arg Val Val Pro Gly 
100 105 110 

Cys Ala Glu Thr Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 
115 120 • 125 

Gly Gin Pro Trp Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin 
130 135 140 
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Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin Gly Gin Gin 
145 150 155 160 

Gly Gin Gin Gly Gin Gin Gly Gin Gin Gin Gin Gly Phe Arg Asp Met 
165 170 175 

His Gin Lys Val Glu His Val Arg His Gly Asp He He Ala He Thr 
180 185 190 

Ala Gly Ser Ser His Trp He Tyr Asn Thr Gly Asp Gin Pro Leu Val 
195 200 205 

He He Cys Leu Leu Asp He Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
210 215 220 

Asn Pro Arg Thr Phe Arg Leu Ala Gly Asn Asn Pro Gin Gly Gly Ser 
225 230 235 240 

Gin Gin Gin Gin Gin Gin Gin Gin Asn Met Leu Ser Gly Phe Asp Pro 

245 250 255 

Gin Val Leu Ala Gin Ala Leu Lys He Asp Val Arg Leu Ala Gin Glu 
260 265 270 

Leu Gin Asn Gin Gin Asp Ser Arg Gly Asn He Val Arg Val Lys Gly 
275 280 285 

Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu Ser Glu 
290 295 300 

Gin Trp Arg His Pro Arg Gly Pro Pro Gin Ser Pro Gin Asp Asn Gly 
305 310 315 320 

Leu Glu Glu Thr He Cys Ser Met Arg Thr His Glu Asn He Asp Asp 

325 330 335 

Pro Ala Arg Ala Asp Val Tyr Lys Pro Asn Leu Gly Arg val Thr Ser 
340 345 350 

Val Asn Ser Tyr Thr Leu Pro He Leu Gin Tyr He Arg Leu Ser Ala 

355 360 365 

'Thx Arg Gly He Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn 
370 375 380 

Met Asn Ala Asn Glu He Leu Tyr Cys Thr Gin Gly Gin Ala Arg He 
385 390 395 400 

Gin Val Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin 

405 410 415 

Lys Gly Gin Leu Val Val He Pro Gin Gly Phe Ala Tyr Val Val Gin 
420 425 430 

Ser His Gin Asn Asn Phe Glu Trp He Ser Phe Lys Thr Asn Ala Asn 
435 440 445 

Ala Met Val Ser Thr Leu Ala Gly Arg Thr Ser Ala Leu Arg Ala Leu 
450 455 460 

Pro Leu Glu Val He Thr Asn Ala Phe Gin He Ser Leu Glu Glu Ala 
465 470 475 480 

Arg Arg He Lys Phe Asn Thr Leu Glu Thr Thr Leu Thr Arg Ala Arg 

485 490 495 

Gly Gly Gin Pro Gin Leu He Glu Glu He Val Glu Ala 
500 505 
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<210> 19 
<211> 1488 
<212> DNA 
<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1485) 

<223> Gycinin A-la-B-x subunit 

<400> 19 

atg gcc aag eta gtt ttt tec ctt tgt ttt ctg ctt ttc agt ggc tgc 48 

Met Ala Lys Leu Val Phe Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
15 10 15 

tgc ttc get ttc agt tec aga gag cag cct cag caa aac gag tgc cag 96 
Cys Pile Ala Phe Ser Ser Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

ate caa aaa etc aat gcc etc aaa ecg gat aac cgt ata gag tea gaa 144 
lie Gin Lys Leu Asn Ala Leu Lys Pro Asp Asn Arg lie Glu Ser Glu 
35 40 45 

QQSL ggg etc att gag aea tgg aac cct aac aac aag oca ttc cag tgt 192 
Gly Gly Leu lie Glu Tlir Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

gcc ggt gtt gcc etc tct cgc tgc ace etc aac cgc aac gcc ctt cgt 240 
Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 80 

aga cct tec tac ace aac ggt cce cag gaa ate tac ate caa caa ggt 288 
Arg Pro Ser Tyr Thr Asn Gly Pro Gin Glu lie Tyr lie Gin Gin Gly 

85 90 95 

aag ggt att ttt ggc atg ata tac ecg ggt tgt cct age aea ttt gaa 336 
Lys Gly He Phe Gly Met He Tyr Pro Gly Cys Pro Ser Thr Phe Glu 

100 105 110 

gag cct caa caa cct caa caa aga gga caa age age aga cea caa gae 3 84 
Glu Pro Gin Gin Pro Gin Gin Arg Gly Gin Ser Ser Arg Pro Gin Asp 
115 120 125 

cgt cac cag aag ate tat aac ttc aga gag ggt gat ttg ate gea gtg 432 
Arg His Gin Lys lie Tyr Asn Phe Arg Glu Gly Asp Leu He Ala Val 
130 135 140 

cct act ggt gtt gea tgg tgg atg tac aac aat gaa gae act cct gtt 480 
Pro Thr Gly Val Ala Trp Trp Met Tyr Asn Asn Glu Asp Thr Pro Val 
145 150 155 160 

gtt gcc gtt tct att att gae ace aac age ttg gag aac cag etc gae 528 
Val Ala Val Ser He He Asp Thr Asn Ser Leu Glu Asn Gin Leu Asp 

165 170 175 

cag atg cct agg aga ttc tat ctt get ggg aac caa gag caa gag ttt 576 
Gin Met Pro Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe 
180 185 190 

eta aaa tat cag caa gag caa gga ggt cat caa age cag aaa gga aag 624 
Leu Lys Tyr Gin Gin Glu Gin Gly Gly His Gin Ser Gin Lys Gly Lys 
195 200 205 

cat cag caa gaa gaa gaa aac gaa gga ggc age ata ttg agt ggc ttc 672 
His* Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser He Leu Ser Gly Phe 
210 215 220 



BNSDOCID: <WO ^03078e29A1_L> 



wo 03/078629 



PCT/EP03/02735 



23 



ttg gaa cat gca ttc age gtg gac aag cag ata gcg 
Leu Glu His Ala Phe Ser Val Asp Lys Gin He Ala 
230 235 240 

gga gag aac gaa ggg gaa gac aag gga gcc att gtg 
Gly Glu Asn Glu Gly Glu Asp Lys Gly Ala He Val 
245 250 255 

ggt ctg age gtg ata aaa cca ccc acg gac gag cag 
Gly Leu Ser Val He Lys Pro Pro Thr Asp Glu Gin 
265 270 
caa caa aga ccc cag gaa gag gaa gaa gaa gaa gag gat gag aag cca 
Gin Gin Arg Pro Gin Glu Glu Glu Glu Glu Glu Glu Asp Glu Lys Pro 
275 280 285 

cag tgc aag ggt aaa gac aaa cac tgc caa cgc ccc cga gga age caa 
Gin Cys Lys Gly Lys Asp Lys His Cys Gin Arg Pro Arg Gly Ser Gin 
290 295 300 



acc ctg gaa ttc 
Thr Leu Glu Phe 
225 

aaa aac eta caa 
Lys Asn Leu Gin 

aca gtg aaa gga 
Thr Val Lys Gly 
260 



age aaa age aga aga aat ggc 
Ser Lys Ser Arg Arg Asn Gly 
305 310 

ctt cgc cac aac att ggc cag 
Leu Arg His Asn He Gly Gin 
325 

caa gcc ggt age gtc aca a'cc 
Gin Ala Gly Ser Val Thr Thr 
340 

' teg tgg etc aga etc agt get 
Ser Trp Leu Arg Leu Ser Ala 
355 

atg ttc gtg cca cac tac aac 
Met Phe Val Pro His Tyr Asn 
370 375 

ttg aat gga egg gca ttg ata 
Leu Asn Gly Arg Ala Leu He 
385 390 

gtg ttt gat gga gag ctg caa 
Val Phe Asp Gly Glu Leu Gin 
405 

aac ttt gtg gtg get gca aga 
Asn Phe Val Val Ala Ala Arg 
420 

tea ttc aag ace aat gat aca 
Ser Phe Lys Thr Asn Asp Thr 
435 

aac tea ttg ttg aac gca tta 
Asn Ser Leu Leu Asn Ala Leu 
450 455 



att gac gag acc ata tgc acc atg aga 
He Asp Glu Thr He Cys Thr Met Arg 
315 320 
act tea tea ect gac ate tac aac ect 
Thr Ser Ser Pro Asp He Tyr Asn Pro 
330 335 

gcc acc age ctt gac ttc cca gcc etc 
Ala Thr Ser Leu Asp Phe Pro Ala Leu 
345 350 

gag ttt gga tct etc cgc aag aat gca 
Glu Phe. Gly Ser Leu Arg Lys Asn Ala 
360 365 

ctg aac gcg aac age ata ata tac gca 
Leu Asn Ala Asn Ser He He Tyr Ala 
380 

caa gtg gtg aat tgc aac ggt gag aga 
Gin Val Val Asn Cys Asn Gly Glu Arg 
395 400 
gag gga egg gtg ctg ate gtg cca caa 
Glu Gly Arg Val Leu He Val Pro Gin 
410 415 

tea cag agt gac aac ttc gag tat gtg 
Ser Gin Ser Asp Asn Phe Glu Tyr Val 
425 430 

ccc atg ate ggc act ctt gca ggg gca 
Pro Met He Gly Thr Leu Ala Gly Ala 
440 445 

cca gag gaa gtg att cag cac act ttc 
Pro Glu Glu Val He Gin His Thr Phe 
460 



aac eta aaa age cag cag gcc agg cag ata aag aac aac aac ect ttc 

Asn Leu Lys Ser Gin Gin Ala Arg Gin He Lys Asn Asn Asn Pro Phe 

465 470 475 480 

aag ttc ctg gtt cca ect cag gag tct cag aag aga get gtg get tag 

Lys Phe Leu Val Pro Pro Gin Glu Ser Gin Lys Arg Ala Val Ala 
485 490 495 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1344 



1392 



1440 



1488 
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<210> 20 ■ 

<211> 495 

<212> PRT 

<213> Glycine max 

<400> 20 ~ 

Met Ala Lys Leu Val Phe Ser Leu Cys Plie Leu Leu Phe Ser Gly Cys 
1-5 10 15 

Cys Pile Ala Phe Ser Ser Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

lie Gin Lys Leu Asn Ala Leu Lys Pro Asp Asn Arg He Glu Ser Glu 
35 40 45 

Gly Gly Leu He Glu* Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 . 80 

Arg Pro Ser Tyr Thr Asn Gly Pro Gin Glu He Tyr He Gin Gin Gly 

85 ■ 90 • 95 

Lys Gly lie Phe Gly Met He Tyr Pro* Gly Cys Pro Ser Thr Phe Glu 
100 105 110 

Glu Pro Gin Gin Pro Gin Gin Arg Gly Gin Ser Ser Arg Pro Gin Asp 
115 120 125 

Arg His Gin Lys He Tyr Asn Phe Arg Glu Gly Asp Leu He Ala Val 
130 135 140 

Pro Thr Gly Val Ala Trp Trp Met Tyr Asn Asn Glu Asp Thr Pro Val 
145 150 155 160 

Val Ala Val Ser He He Asp Thr Asn Ser Leu Glu Asn Gin Leu Asp 

165 170 175 

Gin Met Pro Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe 
180 185 190 

Leu Lys Tyr Gin Gin Glu Gin Gly Gly His Gin Ser Gin Lys Gly Lys 
195 200 205 

His Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser He Leu Ser Gly Phe 
210 215 220 

Thr Leu Glu Phe Leu Glu His Ala Phe Ser Val Asp Lys Gin He Ala 
225 230 235 240 

Lys Asn Leu Gin Gly Glu Asn Glu Gly Glu Asp Lys Gly Ala He Val 
245 250 255 

Thr Val Lys Gly Gly Leu Ser Val He Lys Pro Pro Thr Asp Glu Gin 
260 265 270 

Gin Gin Arg Pro Gin Glu Glu Glu Glu Glu Glu Glu Asp Glu Lys Pro 
275 280 285 

Gin Cys Lys Gly Lys Asp Lys His Cys Gin Arg Pro Arg Gly Ser Gin 
290 295 300 

Ser Lys Ser Arg Arg Asn Gly He Asp Glu Thr He Cys Thr Met Arg 
305 310 315 320 

Leu Arg His Asn He Gly Gin Thr Ser Ser Pro Asp He Tyr Asn Pro 

325 330 * 335 

Gin Ala Gly Ser Val Thr Thr Ala Thr Ser Leu Asp Phe Pro Ala Leu 
340 345 350 
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Ser Trp Leu Arg Leu Ser Ala Glu Phe Gly Ser Leu Arg Lys Asn Ala 
355 360 365 

Met Phe Val Pro His Tyr Asn Leu Asn Ala Asn Ser lie lie Tyr Ala 
370 375 380 

Leu Asn Gly Arg Ala Leu lie Gin Val Val Asn Cys Asn Gly Glu Ara 
385 ^ 390 395 400 

Val Phe Asp Gly Glu Leu Gin Glu Gly Arg Val Leu lie Val Pro Gin 

405 410 415 

Asn Phe Val Val Ala Ala Arg Ser Gin Ser Asp Asn Phe Glu Tyr Val 
420 425 430 

Ser Phe Lys Thr Asn Asp Thr Pro Met lie Gly Thr Leu Ala Gly Ala 
. 435 440 445 

Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu Val He Gin His Thr Phe 
450 455 460. 

Asn Leu Lys Ser Gin Gin Ala Arg Gin He Lys Asn Asn Asn Pro Phe 
465 470 475 480 

Lys Phe Leu Val Pro Pro Gin Glu Ser Gin Lys Arg Ala Val Ala 
485 490 495 



<210> 21 
<211> 1458 
<212> DNA 
<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1455) 

<223> glycinin G2 subunit 

<400> 21 

atg gcc aag ctt gtt ctt tec ctt tgt ttc ctt ctt ttc agt ggc tgc 
Met Ala Lys Leu Val Leu Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 

.15 



15 10 



48 



96 



ttc get ctg aga gag cag gca cag caa aat gag tgc cag ate caa aag 
Phe Ala Leu Arg Glu Gin Ala Gin Gin Asn Glu Cys Gin He Gin Lys 

20 25 30 . 

ctg aat gee etc aaa ceg gat aac egt ata gag teg gaa ggt ggg ttc 144 
Leu Asn Ala Leu Lys Pro Asp Asn Arg He Glu Ser Glu Gly Gly Phe 
35 40 45 

att gag aca tgg aac cct aac aac aag cca ttc cag tgt gcc ggt gtt 192 
He Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys Ala Glv Val 
50 55 60 

gcc etc tct cgc tgc ace ctt aac cgc aat gee ett egt aga cct tee 
Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg Arg Pro Ser 
65 70 75 80 

tae ace aac ggt cce cag gaa ate tac ata caa caa ggt aat ggt att 288 
Tyr Thr Asn Gly Pro Gin Glu He Tyr He Gin Gin Gly Asn Gly He 

85 90 95 

ttt ggc atg ata ttc ceg ggt tgt cct age act tat caa gag ceg caa 336 
Phe Gly Met He Phe Pro Gly Cys Pro Ser Thr Tyr Gin Glu Pro Gin 
100 105 110 



240 
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gaa tct cag caa cga gga cga age cag agg ccc caa gac cgt cac caa 384 
Glu Ser Gin Gin Arg Gly Arg Ser Gin Arg Pro Gin Asp Arg His Gin 
115 120 125 

aag gta cat cgc ttc aga gag ggt gat ttg ate gca gtg cct aet ggt 432 
Lys Val His Arg Phe Arg Glu Gly Asp Leu lie Ala Val Pro Thr Gly 
130 135 140 

gtt gea tgg tgg atg tac aac aat gaa gac act cct gtt gtt gcc gtt 480 
Val Ala Trp Trp Met Tyr Asn Asn Glu Asp Tlir Pro Val Val Ala Val 
145 150 155 160 

tct att att gac ace aac age ttg gag aac cag etc gac cag atg cct 528 
Ser He He Asp Thr Asn Ser Leu Glu Asn Gin Leu Asp Gin Met Pro 
165 170 175 

agg aga ttc tat ctt get ggg aac caa gag caa gag ttt eta aaa tat 576 
Arg Arg Pile Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe Leu Lys Tyr 
180 l'85 190 

cag cag cag cag caa gga ggt tee caa age cag aaa gga aag caa caa 624 
Gin Gin Gin Gin Gin Gly Gly Ser Gin Ser Gin Lys Gly Lys Gin Gin 
195 200 205 

gaa gaa gaa aac gaa gga age aac ata ttg agt ggc ttc gee cct gaa 672 
Glu Glu Glu Asn Glu Gly Ser Asn He Leu Ser Gly Phe Ala Pro Glu 
210 215 220 

ttc ttg aaa gaa gcg ttc ggc gtg aac atg cag ata gtg aga aac eta 720 
Phe Leu Lys Glu Ala Phe Gly Val Asn Met Gin lie Val Arg Asn Leu 
225 230 235 240 

caa ggt gag aac gaa gag gag gat agt gga gee att gtg aca gtg aaa 768 
Gin Gly Glu Asn Glu Glu Glu Asp Ser Gly Ala He Val Thr Val Lys 
245 250 255 

gga ggt eta aga gtc aca get cca gcc atg agg aag cca cag caa gaa 816 
Gly Gly Leu Arg Val Thr Ala Pro Ala Met Arg Lys Pro Gin Gin Glu 
260 265 270 

gaa gat gat gat gat gag gaa gag cag cca cag tgc gtg gag aca gac 864 
Glu Asp Asp Asp Asp Glu Glu Glu Gin Pro Gin Cys Val Glu Thr Asp 
275 280 285 

aaa ggt tgc caa cgc caa age aaa agg age aga aat ggc att gat gag 912 
Lys Gly Cys Gin Arg Gin Ser Lys Arg Ser Arg Asn Gly He Asp Glu ■ 
290 295 300 

ace att tgc aca atg aga ctt cgc caa aac att ggt cag aat tea tea 960 
Thr lie Cys Thr Met Arg Leu. Arg Gin Asn He Gly Gin Asn Ser Ser 
305 310 315 320 

cct gac ate tac aac cct caa get ggt age ate aca acc gcc acc age 1008 
Pro Asp lie Tyr Asn Pro Gin Ala Gly Ser He Thr Thr Ala Thr Ser 
325 330 335 

ctt gac ttc cca gee etc tgg ctt etc aaa etc agt gee cag tat gga 1056 
Leu Asp Phe Pro Ala Leu Trp Leu Leu Lys Leu Ser Ala Gin Tyr Gly 
340 345 350 

tea etc cgc aag aat get atg ttc gtg cca cac tac acc etg aac gcg 1104 
Ser Leu Arg Lys Asn Ala Met Phe Val Pro His Tyr Thr Leu Asn Ala 
355 360 365 

aac age ata ata tac gea ttg aat ggg egg gca ttg gta caa gtg gtg 1152 
Asn Ser He He Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val 
370 375 380 
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aat tgc aat ggt gag aga gtg ttt gat gga gag ctg caa gag gga ggg 1200 
Asn Cys Asn Gly Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gly 
385 390 395 400 

gtg ctg ate gtt cca caa aac ttt gcg gtg get gca aaa tec cag age 1248 
Val Leu lie Val Pro Gin Asn Phe Ala Val Ala Ala L,ys Ser Gin Ser 
405 410 415 

gat aac ttt gag tat gtg tea tte aag ace aat gat aga ccc teg ate 1296 
Asp Asn Phe Glu Tyr Val Ser Phe Lys Thr Asn Asp Arg Pro Ser lie 
420 425 430 

gga aac ctt gca ggg gca aac tea ttg ttg aac gca ttg cca gag gaa 1344 
Gly Asn Leu Ala Gly Ala Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu 
435 440 445 

gtg att cag cac act ttt aac eta aag age cag cag gee agg cag gtg 1392 
Val lie Gin His Thr Phe Asn Leu Lys Ser Gin Gin Ala Arg Gin Val 
450 455 460 

aag aac aac aac cet ttc age tte ctt gtt cca cet cag gag tct cag 1440 
Lys .Asn Asn Asn Pro Phe Ser Phe Leu Val Pro Pro Gin Glu Ser Gin 
465 470 475 480 

agg aga get gtg get tag 1458 
Arg Arg Ala Val Ala 
485 

<210> 22 

<211> 485 

<212> PRT 

<213> Glycine max 

<400> 22 



Met 
1 


Ala 


Lys 


Leu 


Val 

5 


Leu 


Ser Leu Cys 


Phe 
10 


Leu 


Leu 


Phe 


Ser 


Gly Cys 
15 


Phe 


Ala 


Leu 


Arg 
20 


Glu 


Gin 


Ala Gin Gin 
25 


Asn 


Glu 


Cys 


Gin 


He 
30 


Gin Lys 


Leu 


Asn 


Ala 

35 


Leu 


Lys 


Pro Asp Asn Arg 
40 


He 


Glu 


Ser 


Glu 
45 


Gly 


Gly Phe 


lie 


Glu 
50 


Thr 


Trp 


Asn 


Pro 


Asn Asn Lys 
55 


Pro 


Phe 


Gin 
60 


Cys 


Ala 


Gly Val 


Ala 
65 


Leu 


Ser 


Arg 


Cys 


Thr 
70 


Leu Asn Arg 


Asn 


Ala 
75 


Leu 


Arg 


Arg 


Pro Ser 
80 


Tyr 


Thr 


Asn Gly 


Pro 
85 


Gin 


Glu He Tyr 


He 
90 


Gin 


Gin 


Gly Asn 


Gly He 
95 


Phe 


Gly 


Met 


He 
100 


Phe 


Pro 


Gly Cys Pro 
105 


Ser 


Thr 


Tyr 


Gin 


Glu 
110 


Pro Gin 


Glu 


Ser 


Gin 
115 


Gin 


Arg Gly Arg Ser Gin Arg Pro Gin Asp Arg His Gin 

120 125 


Lys 


Val 
130 


His 


Arg 


Phe 


Arg 


Glu Gly Asp 
135 


Leu 


He 


Ala 
140 


Val 


Pro 


Thr Gly 


Val 
145 


Ala 


Trp 


Trp 


Met 


Tyr 
150 


Asn Asn Glu 


Asp 


Thr 
155 


Pro 


Val 


Val 


Ala Val 
160 


Ser 


He 


He 


Asp 


Thr 
165 


Asn 


Ser Leu Glu 


Asn 
170 


Gin 


Leu 


Asp 


Gin 


Met Pro 
175 


Arg 


Arg 


Phe 


Tyr 
180 


Leu 


Ala 


Gly Asn Gin 
185 


Glu 


Gin 


Glu 


Phe 


Leu 
190 


Lys Tyr 
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Gin Gin Gin Gin Gin Gly Gly Ser Gin Ser Gin Lys Gly Lys Gin Gin 
195 200 205 

Glu Glu Glu Asn Glu Gly Ser Asn He Leu Ser Gly Phe Ala Pro Glu 
210 215 220 

Phe Leu Lys Glu Ala Phe Gly Val Asn Met Gin He Val Arg Asn Leu 

225 230 235 240 

Gin Gly Glu Asn Glu Glu Glu Asp Ser Gly Ala He Val Thr Val Lys 
245 , 250 255 

Gly Gly Leu Arg Val Thr Ala Pro Ala Met Arg Lys Pro Gin Gin Glu 
260 265 270 

Glu Asp Asp Asp Asp Glu Glu Glu Gin Pro Gin Cys Val Glu Thr Asp 
275 280 285 

Lys Gly Cys Gin Arg Gin Ser Lys Arg Ser Arg Asn Gly He Asp Glu 
290 295 300 

Thr He Cys Thr Met Arg Leu Arg Gin Asn He Gly Gin Asn Ser Ser 
305 310 315 320 

Pro Asp He Tyr Asn Pro Gin Ala Gly Ser He Thr Thr Ala Thr Ser 
325 330 335 

Leu Asp Phe Pro Ala Leu Trp Leu Leu Lys Leu Ser Ala Gin Tyr Gly 
340 . 345 350 

Ser Leu Arg Lys Asn Ala Met Phe Val Pro His Tyr Thr Leu Asn Ala 
355 360 365 

Asn Ser He He Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val 
370 375 3&0 

Asn Cys Asn Gly Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gly 
385 390 395 400 

Val Leu He Val Pro Gin Asn Phe Ala Val Ala Ala Lys Ser Gin Ser 
405 410 415 

Asp Asn Phe Glu Tyr Val Ser Phe Lys Thr Asn Asp Arg Pro Ser He 
420 425 430 

Gly Asn Leu Ala Gly Ala Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu 
435 440 445 

Val He Gin His Thr Phe Asn Leu Lys Ser Gin Gin Ala Arg Gin Val 
450 455 460 

Lys Asn Asn Asn Pro Phe Ser Phe Leu Val Pro Pro Gin Glu Ser Gin 
465 470 475 480 

Arg Arg Ala Val Ala 
485 



<210> 23 
<211> 1689 
<212> DNA 
<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1686) 

<223> glycinin A5A4B3 subunits 

<400> 23 

atg ggg aag ccc ttc act etc tct ctt tct tec ctt tgc ttg eta etc 48 
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Met Gly Lys Pro Phe Thr Leu Ser Leu Ser Ser Leu Cys Leu Leu Leu 
1 5 10 15 

ttg teg agt gca tgc ttt get att age tec age aag cte aac gag tgc 96 
Leu Ser Ser Ala Cys Phe Ala lie Ser Ser Ser Lys Leu Asn Glu Cys 
20 25 30 

caa etc aac aac etc aac gcg ttg gaa cce gac cae cge gtt gag tec 144 
Gin Leu Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu Ser 
35 40 45 

gaa ggt ggt ttg att caa aca tgg aac tct caa cae cct gag ctg aaa 192 
Glu Gly Gly Leu lie Gin Thr Trp Asn Ser Gin His Pro Glu Leu Lys 
50 55. 60 

tgc gcc ggt gtc act gtt tec aaa etc ace etc aac cge aat gge etc 240 
Cys Ala Gly Val Tlir Val Ser Lys Leu Thr Leu Asn Arg Asn Gly Leu 
65 70 75 80 

cae teg cca tct tac tea cct tat cec egg atg ate ate ate gee caa 288 
His Ser Pro Ser Tyr Ser Pro Tyr Pro Arg Met lie lie lie Ala Gin 

85 90 95 

ggg aaa gga gca ctt gga gtt gca att cca gga tgt cct gag aeg ttt 336 
Gly Lys Gly Ala Leu Gly Val Ala lie Pro Gly Cys Pro Glu Thr Phe 
100 105 110 

gag gag cca caa gaa caa tea aac aga aga gge tea agg teg cag aag 3 84 
Glu Glu Pro Gin Glu Gin Ser Asn Arg Arg Gly Ser Arg Ser Gin Lys 
115 120 125 

cag cag eta cag gac agt cae cag aag att cgt cae tte aat gaa gga 432 
Gin Gin Leu Gin Asp Ser His Gin Lys He Arg His Phe Asn Glu Gly 
130 135 140 

gac gta cte gtg att cct ect agt gtt eet tac tgg ace tat aac act 480 
Asp Val Leu VaJL He Pro Pro Ser Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 .155 160 

gge gat gaa cea gtt gtt gee ate agt ctt ctt gac ace tct aac tte 528 
Gly Asp Glu Pro Val Val Ala He Ser Leu Leu Asp Thx Ser Asn Phe 
165 170 175 

aat aac cag ctt gat caa ace eet agg gta ttt tac ctt get ggg aac 576 
Asn Asn Gin Leu Asp Gin Thr Pro Arg Val Phe Tyr Leu Ala Gly Asn' 
180 185 190 

cca gat ata gag tac cca gag ace atg caa caa caa caa cag cag aaa 624 
Pro Asp He Glu Tyr Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 
195 200 205 

agt eat ggt gga cge aag cag ggg caa cac cag cag gag gaa gag gaa 672 
Ser His Gly Gly Arg Lys Gin Gly Gin His Gin Gin Glu Glu Glu Glu 
210 215 220 

gaa ggt gge age gtg etc agt gge tte age aaa cae tte ttg gca caa 720 
Glu Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin 

225 230 235 240 

tec tte aac acc aac gag gac ata get gag aaa ctt gag tct cca gac 768 
Ser Phe Asn Thr Asn Glu Asp He Ala Glu Lys Leu Glu Ser Pro Asp 
245 250 255 

gac gaa agg aag cag ate gtg aca gtg gaa gga ggt cte age gtt ate 816 
Asp Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He 
260 265 270 
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age ccc aag tgg caa gaa caa caa gat gaa gat gaa gat gaa gac gaa 864 
Ser Pro Lys Trp Gin Glu Gin Gin Asp Glu Asp Glu Asp Gin Asp Glu 
275 280 285 

gat gat gaa gat gaa caa att ccc tct cac cct cct ego cga cca age 912 
Asp Asp Glu Asp Glu Gin lie Pro Ser His Pro Pro Arg Arg Pro Ser 
290 295 300 

cat gga aag cgt gaa caa gac gag gac gag gac gaa gat gaa gat aaa 960 
His Gly Lys Arg Glu Gin Asp Glu Asp Glu Asp Glu Asp Glu Asp Lys 
305 310 315 320 

cct cgt cct agt cga cca age caa gga aag egg aac aag aca gga cag 1008 
Pro Arg Pro Ser Arg Pro Ser Gin Gly Lys Arg Asn Lys Thr Gly Gin 
325 330 335 

gac gag gac gaa gat gaa gat gaa gat caa cct cgc aag age cgc gaa 1056 
Asp Glu Asp Glu Asp Glu Asp Glu Asp Gin Pro Arg Lys Ser Arg Glu 
340 345 350 

tgg aga teg aaa aag aca caa ccc aga aga cct aga caa gaa gaa cca 1104 
Trp Arg Ser Lys Lys Tlir Gin Pro Arg Arg Pro Arg Gin Glu Glu Pro 
355 360 365 

cgt gaa aga gga tge gag aca aga aac ggg gtt gag gaa aat ate tgc 1152 
Arg Glu Arg Gly Cys Glu Thx Arg Asn Gly Val Glu Glu Asn lie Cys 
370 375 380 

acc ttg aag ctt cac gag aac att get cgc cct tea cgc get gac ttc 1200 
Thr Leu Lys Leu His Glu Asn lie Ala Arg Pro Ser Arg Ala Asp Phe 
385 390. 395 400 

tac aac cct aaa get ggt cgc att agt acc etc aac age etc acc etc 1248 
Tyr Asn Pro Lys Ala Gly Arg lie Ser Thr Leu Asn Ser Leu "Hir Leu 
405 410 415 

cca gee etc cgc caa ttc caa etc agt gee caa tat gtt gte etc tac 1296 
Pro Ala Leu Arg Gin Plie Gin Leu Ser Ala Gin Tyr Val Val Leu Tyr 
420 425 430 

aag aat gga att tac tct cca eat tgg aat etg aat gea aac agt gtg 1344 
Lys Asn Gly lie Tyr Ser Pro His Trp Asn Leu Asn Ala Asn Ser Val 
435 -440 445 

ate tat gtg act cga gga caa gga aag gtt aga gtt gtg aac tgq caa . 1392 
He Tyr Val Thr Arg Gly Gin Gly Lys Val Arg Val Val Asn Cys Gin 
450 455 460 

ggg aat gea gtg ttc gac ggt gag ctt agg agg gga caa ttg ctg gtg 1440 
Gly Asn Ala Val Phe Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val 
465 470 475 480 

gta cca cag aac ttc gtg gtg geg gag caa gee gga gaa caa gga ttc 1488 
Val Pro Gin Asn Phe Val Val Ala Glu Gin Ala Gly Glu Gin Gly Phe 

485 490 495 

gaa tac ata gta ttc aag aca cac cac aac gea gte act age tac ttg 153 6 
Glu Tyr He Val Phe Lys Thr His His Asn Ala Val Thr Ser Tyr Leu 
500 505 510 

aag gat gtg ttt agg gea att ccc tea gag gtt ctt gee cat tct tac 1584 
Lys Asp Val Phe Arg Ala He Pro Ser Glu Val Leu Ala His Ser Tyr 
515 520 525 

aac ctt cga cag agt caa gtg tct gag ctt aag tat gaa gga aat tgg 1632 
Asn Leu Arg Gin Ser Gin Val Ser Glu Leu Lys Tyr Glu Gly Asn Trp 
530 535 540 
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ggt cct ttg gtc aac cct gag tct caa caa ggc tea ccc cgt gtt aaa 1680 

Gly Pro Leu Val Asn Pro Glu Ser Gin Gin Gly Ser Pro Arg Val Lys 
545 550 555 560 

gtc gca taa 1689 
Val Ala 

<210> 24 

<211> 562 

<212> PRT 

<213> Glycine max 

<400> 24 

Met Gly Lys Pro Phe ITfcir Leu Ser Leu Ser Ser Leu Cys Leu Leu Leu 

15 10 15 

Leu Ser Ser Ala Cys Phe Ala lie Ser Ser Ser Lys Leu Asn Glu Cys 
20 25 30 

Gin Leu Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu Ser 
35 40 45 

Glu Gly Gly Leu lie Gin Thr Trp Asn Ser Gin His Pro Glu Leu Lys 
50 55 60 

Cys Ala Gly Val Thr Val Ser Lys Leu Thr Leu Asn Arg Asn Gly Leu 
65 70 75 80 

His Ser Pro Ser Tyr Ser Pro Tyr Pro. Arg Met lie He He Ala Gin 

85 90 95 

Gly Lys Gly Ala Leu Gly Val Ala He Pro Gly Cys Pro Glu Thr Phe 
100 105 110 

Glu Glu Pro Gin Glu Gin Ser Asn Arg Arg Gly Ser Arg Ser Gin Lys 

115 ' 120 125 

Gin Gin Leu Gin Asp Ser His Gin Lys He Arg His Phe Asn Glu Gly 
130 135 140 

Asp Val Leu Val He Pro Pro Ser Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 155 160 

Gly Asp Glu Pro Val Val Ala He Ser Leu Leu Asp Thr Ser Asn Phe 

165 170 175 

Asn Asn Gin Leu Asp Gin Thr Pro Arg Val Phe Tyr Leu Ala Gly Asn 
180 185 190 

Pro Asp He Glu Tyr Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 

195 200 205 

Ser His Gly Gly Arg Lys Gin Gly Gin His Gin Gin Glu Glu Glu Glu 
210 215 220 

Glu Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin 

225 230 235 240 

Ser Phe Asn Thr Asn Glu Asp He Ala Glu Lys Leu Glu Ser Pro Asp 

245 250 255 

Asp Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He 
260 265 270 

Ser Pro Lys Trp Gin Glu Gin Gin Asp Glu Asp Glu Asp Glu Asp Glu 

275 280 285 

Asp Asp Glu Asp Glu Gin He Pro Ser His Pro Pro Arg Arg Pro Ser - 
290 295 300 
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His Gly Lys Arg Glu Gin Asp Glu Asp Glu Asp Glu Asp Glu Asp Lys 
305 310 315 320 

Pro Arg Pro Ser T^g Pro Ser Gin Gly Lys Arg Asn Lys Thr Gly Gin 
325 330 335 

Asp Glu Asp Glu Asp Glu Asp Glu Asp Gin Pro Arg Lys Ser Arg Glu 
340 345 350 

Trp Arg Ser Lys Lys Thr Gin Pro Arg Arg Pro Arg Gin Glu Glu Pro 
355 360 365 

Arg Glu Arg Gly Cys Glu Thr Arg Asn Gly Val Glu Glu Asn lie Cys 
370 375 380 

Thr Leu Lys Leu His Glu Asn lie Ala Arg Pro Ser Arg Ala Asp Phe 
385 390 395 400 

Tyr Asn Pro Lys Ala Gly Arg lie Ser Thr Leu Asn Ser Leu Thr Leu 
405 410 415 

Pro Ala Leu Arg Gin Phe Gin Leu Ser Ala Gin Tyr Val Val Leu Tyr 
420 425 430 

Lys Asn Gly lie Tyr Ser Pro His Trp Asn Leu Asn Ala Asn Ser Val 

435 440 445 

He Tyr Val Thr Arg Gly Gin Gly Lys Val Arg Val Val Asn Cys Gin 
450 455 460 

Gly Asn Ala Val Phe Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val 
465 470 475 480 

Val Pro Gin Asn Phe Val Val Ala Glu Gin Ala Gly Glu Gin Gly Phe 
485 490 495 

Glu Tyr He Val Phe Lys Thr His His Asn Ala Val Thr Ser Tyr Leu 

500 505 510 

Lys Asp Val Phe Arg Ala He Pro Ser Glu Val Leu Ala His Ser Tyr 
515 520 525 

Asn Leu Arg Gin Ser Gin Val Ser Glu Leu Lys Tyr Glu Gly Asn Trp 
530 535 540 

Gly Pro Leu Val Asn Pro Glu Ser Gin Gin Gly Ser Pro Arg Val Lys 
545 550 555 560 

Val Ala 



<210> 25 

<211> 1551 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1548) 

<223> glycinin A3-B4 subunit 

<400> 25 

atg ggg aag ccc ttc ttc act etc tct ctt tct tec ctt tgc ttg eta 48 
Met Gly Lys Pro Phe Phe Thr Leu Ser Leu Ser Ser Leu Cys Leu Leu 
15 10 15 

etc ttg teg agt gca tgc ttt get att acc tec age aag ttc aac gag 96 
Leu Leu Ser Ser Ala Cys Phe Ala He Thr Ser Ser Lys Phe Asn Glu 
20 25 30 
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tgc caa etc aac aac etc aac gcg ttg gaa ccc gac cac cgc gtt gag 144 
Cys Gin Leu Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu 
35 40 45 

tec gaa ggt ggt ctt att gaa aca tgg aac tct caa cac cct gag ctg 192 
Ser Glu Gly Gly Leu lie Glu Thr Trp Asn Ser Gin His Pro Glu Leu 
50 55 60 

caa tgc gee ggt gtc act gtt tec aaa cgc acc etc aac cgc aac ggc 240 
Gin Cys Ala Gly Val Thr Val Ser Lys Arg Thr Leu Asn Arg Asn Gly 
65 70 ' 75 . 80 

tec cac ttg cca tct tac tta cct tat ccc caa atg ate att gtc gtt 288 
Ser His Leu Pro Ser Tyr Leu Pro Tyr Pro Gin Met He He Val Val 

85 90 95 

caa ggg aag gga gca att gga ttt gea ttt ceg gga tgt ccc gag acg 336 
Gin Gly Lys Gly Ala He Gly Phe Ala Phe Pro Gly Cys Pro Glu Thr 
100 105 110 

ttt gag aag cca caa caa caa tea age aga aga ggc tea agg tea cag 3 84 
Phe Glu Lys Pro Gin Gin Gin Ser Ser Arg Arg Gly Ser Arg Ser Gin 
115 120 125 

cag caa eta caa gac agt cac cag aag att cgt cac ttc aat gaa gga 432 
Gin Gin Leu Gin Asp Ser His Gin Lys He Arg His Phe Asn Glu Gly 
130 135 140 

gac gta eta gtg att cct ctt ggt gtt cct tac tgg acc tat aac act 480 
Asp Val Leu Val He Pro Leu Gly Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 155 160 

ggc gat gaa cca gtt gtt gee ate agt cct ctt gac acc tec aac ttc 528 
Gly Asp Glu Pro Val Val Ala He Ser Pro Leu Asp Thr Ser Asn Phe 
165 170 175 

aac aat cag ctt gat caa aac ccc aga gta ttt tac ctt get ggg aac 576 
Asn Asn Gin Leu Asp Gin Asn Pro Arg Val Phe Tyr Leu Ala Gly Asn 
180 185 190 

cca gat ata gag cat ccc gag acc atg caa caa cag cag cag cag aag 624 
Pro Asp He Glu His Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 
195 200 205 

agt cat ggt gga cgc aag cag ggg caa cac cga cag cag gag gaa gaa 672 
•Ser His Gly Gly Arg Lys Gin Gly Gin His Arg Gin Gin Glu Glu Glu 
210 215 220 

ggt ggc agt gtg etc agt ggc ttc age aaa cat ttc tta gca caa tec 720 
Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin Ser 
225 230 235 240 

ttc aac acc aac gag gac aca get gag aaa ctt egg tct cca gat gac 768 
Phe Asn Thr Asn Glu' Asp Thr Ala Glu Lys Leu Arg Ser Pro Asp Asp 
245 250 255 

gaa agg aag cag ate gtg aca gtg gag gga ggc etc age gtt ate age 816 
Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He Ser 

260 265 270 

ccc aag tgg caa gaa caa gaa gac gaa gac gaa gac gaa gac gaa gaa 8 64 
Pro Lys Trp Gin Glu Gin Glu Asp Glu Asp Glu Asp Glu Asp Glu Glu 

275 280 285 

tat gga egg acg ccc tct tat cct cca cga cga cca age cat gga aag 912 
Tyr Gly Arg Thr Pro Ser Tyr Pro Pro Arg Arg Pro Ser His Gly Lys 
290 295 300 
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cat gaa gat gac gag gac gag gac gaa gaa gaa gat caa cct cgt cct 960 

His Glu Asp Asp Glu Asp Glu Asp Glu Glu Glu Asp Gin Pro Arg Pro 
305 310 315 320 

gat cac cct cca cag cga cca age agg ccc gaa caa caa gaa cca cgt 1008 
Asp His Pro Pro Gin Arg Pro Ser Arg Pro Glu Gin Gin Glu Pro Arg 
325 330 335 

gga aga gga tgt cag act aga aat ggg gtt gag gaa aat att tgc acc 1056 
Gly Arg Gly Cys Gin Thr Arg Asn Gly Val Glu Glu Asn lie Cys Thr 
340 345 • 350 

atg aag ctt cac gag aac att get cgc cct tea cgt get gac ttc tac 1104 
Met Lys Leu His Glu Asn lie Ala Arg Pro Ser Arg Ala Asp Phe Tyr 
355 360 365 

aac cca aaa get ggt cgc att age acc etc aac agt etc acc etc cca 1152 
Asn Pro Lys Ala Gly Arg lie Ser Thr Leu Asn Ser Leu Thr Leu Pro 
370 375 380 

gcc etc cgc caa ttc gga etc agt gcc caa tat gtt gtc etc tac agg 1200 
Ala Leu Arg Gin Phe Gly Leu Ser Ala Gin Tyr Val Val Leu Tyr Arg 
385 390 395 400 

aat gga att tac tet cca gat tgg aac ttg aac gcg aac agt gtg aeg 1248 
Asn Gly lie Tyr Ser Pro Asp Trp Asn Leu Asn Ala Asn Ser Val Thr 
405 410 415 

atg act cga ggg aaa gga aga gtt aga gtg gtg aac tgc caa ggg aat 1296 
Met Thr Arg Gly Lys Gly Arg Val Arg Val Val Asn Cys Gin Gly Asn 
420 425 430 

gca gtg ttc gac ggt gag eta agg agg gga caa ttg eta gtg gtg ccg 1344 
Ala Val Phe Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val Val Pro 
435 440 445 

cag aac ccc gcg gtg get gag caa ggg gga gaa caa gga ttg gaa tat 1392 
Gin Asn Pro Ala Val Ala Glu Gin Gly Gly Glu Gin Gly Leu Glu Tyr 
450 455 460 

gta gtg ttc aag aca cac cac aac gee gtg age age tac att aag gat 1440 
Val Val Phe Lys Thr His His Asn Ala Val Ser Ser Tyr lie Lys Asp 
465 470 475 480 

gtg ttt agg gta ate cct teg gag gtt ctt tec aat tet tac aac ctt 1488 
Val Phe Arg Val lie Pro Ser Glu Val Leu Ser Asn Ser Tyr Asn Leu 
485 490 495 

ggc cag agt caa gtg cgt cag etc aag tat caa gga aac tec gge cct 1536 
Gly Gin Ser Gin Val Arg Gin Leu Lys Tyr Gin Gly Asn Ser Gly Pro 
500 505 510 

ttg gtc aac cca taa 1551 
Leu Val Asn Pro 
515 

<210> 26 

<211> 516 

<212> PRT 

<213> Glycine max 

<400> 26 

Met Gly Lys Pro Phe Phe Thr Leu Ser Leu Ser Ser Leu Cys Leu Leu 
1 5 10 15 

Leu Leu Ser Ser Ala Cys Phe Ala lie Thr Ser Ser Lys Phe Asn Glu 
20 25 30 



BNSDOCID: <WO 0307e629A1 J_> 



wo 03/078629 PCT/EP03/02735 

35 

Cys Gin Leii Asn Asn Leu Asn Ala Leu Glu Pro Asp His Arg Val Glu 
35 40 45 

Ser Glu Gly Gly Leu lie Glu Thr Torp Asn Ser Gin His Pro Glu Leu 
50 55 60 

Gin Cys Ala Gly Val Thr Val Ser Lys Arg Thr Leu Asn Arg Asn Gly 
65 70 75 80 

Ser His Leu Pro Ser Tyr Leu Pro Tyr Pro Gin Met lie lie Val Val 

85 90 95 

Gin Gly Lys Gly Ala He Gly Phe Ala Phe Pro Gly Cys Pro Glu Thr 
100 105 110 

Phe Glu Lys Pro Gin Gin Gin Ser Ser Arg Arg Gly Ser Arg Ser Gin 
115 120 125 

Gin Gin Leu Gin Asp Ser His Gin Lys He Arg His Phe Asn Glu Gly 
130 135 140 

Asp Val Leu Val He Pro Leu Gly Val Pro Tyr Trp Thr Tyr Asn Thr 
145 150 155 160 

Gly Asp Glu Pro Val Val . Ala lie Ser Pro Leu Asp Thr Ser- Asn. Phe 
165 170 175 

Asn Asn Gin Leu Asp Gin Asn Pro Arg Val Phe Tyr Leu Ala Gly Asn 
180 185 190 

Pro Asp He Glu His Pro Glu Thr Met Gin Gin Gin Gin Gin Gin Lys 
195 200 205 

Ser His Gly Gly Arg Lys Gin Gly Gin His Arg Gin Gin Glu Glu Glu 
210 215 220 

Gly Gly Ser Val Leu Ser Gly Phe Ser Lys His Phe Leu Ala Gin Ser 
225 230 235 240 

Phe Asn Thr Asn Glu Asp Thr Ala Glu Lys Leu Arg Ser Pro Asp Asp 

245 250 255 

Glu Arg Lys Gin He Val Thr Val Glu Gly Gly Leu Ser Val He Ser 
260 265 270 

Pro Lys Trp Gin Glu Gin Glu Asp Glu Asp Glu Asp Glu Asp Glu Glu 

275 280 285 

Tyr Gly Arg Thr Pro Ser Tyr Pro Pro Arg Arg Pro Ser His Gly Lys 
290 295 300 

His Glu Asp Asp Glu Asp Glu Asp Glu Glu Glu Asp Gin Pro Arg Pro 
305 310 315 320 

Asp His Pro Pro Gin Arg Pro Ser Arg Pro Glu Gin Gin Glu Pro Arg 
325 330 335 

Gly Arg Gly Cys Gin Thr Arg Asn Gly Val Glu Glu Asn He Cys Thr 

340 345 350 

Met Lys Leu His Glu Asn He Ala Arg Pro Ser Arg Ala Asp Phe Tyr 
355 360 365 

Asn Pro Lys Ala Gly Arg He Ser Thr Leu Asn Ser Leu Thr Leu Pro 
370 375 380 

Ala Leu Arg Gin Phe Gly Leu Ser Ala Gin Tyr Val Val Leu Tyr Arg 
385 390 395 400 

Asn Gly He Tyr Ser Pro Asp Trp Asn Leu Asn Ala Asn Ser Val Thr 
405 410 415 
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Met Thr Arg Gly Lys Gly Arg Val Arg Val Val Asn Cys Gin Gly Asn 
420 425 430 

Ala Val Plie Asp Gly Glu Leu Arg Arg Gly Gin Leu Leu Val Val Pro 
435 440 445 

Gin Asn Pro Ala Val Ala Glu Gin Gly Gly Glu Gin Gly Leu Glu Tyr 
450 455 460 

Val Val Phe Lys Thr His His Asn Ala Val Ser Ser Tyr lie Lys Asp 
465 470 475 480 

Val Phe Arg Val lie Pro Ser Glu Val Leu Ser Asn Ser Tyr Asn Leu 
485 490 495 

Gly Gin Ser Gin Val Arg Gin Leu Lys Tyr Gin Gly Asn Ser Gly Pro 
500 505 510 

Leu Val Asn Pro 
515 

<210> 27 

<211> 1446 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1443) 

<223> glycinin G3 subunit 

<400> 27 

atg get aag ctt gtt ctt tec ctt tgt ttt ctg ctt ttc agt ggc tgc 48 

Met Ala Lys Leu Val Leu Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
15 10 15 

tgc ttc get ttc agt ttc aga gag cag cca cag caa aae gag tgc cag 96 
Cys Phe Ala Phe Ser Phe Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

ate caa cgc etc aat gcc eta aaa ccg gat aac cgt ata gag tea gaa 144 
lie Gin Arg Leu Asn Ala Leu Lys Pro Asp Asn Arg lie Glu Ser Glu 
35 40 45 

ggt ggc ttc att gag aca tgg aac cet aac aac aag cca ttc cag tgt 192 
Gly Gly Phe lie Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

gcc ggt gtt gcc etc tct cgc tgc acc etc aac cgc aac gcc ctt cgc 240 
Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 80 

aga cct tee tac ace aac get ecc cag gag ate tae ate caa caa ggt 288 
Arg Pro Ser Tyr Thr Asn Ala Pro Gin Glu lie Tyr lie Gin Gin Gly 

85 90 95 

agt ggt att ttt ggc atg ata ttc ccg ggt tgt cct age aca ttt gaa 33 6 
Ser Gly lie Phe Gly Met lie Phe Pro Gly Cys Pro Ser Thr Phe Glu 
100 105 110 

gag cct caa caa aaa gga caa age age agg ecc caa gae cgt eac cag 384 
Glu Pro Gin Gin Lys Gly Gin Ser Ser Arg Pro Gin Asp Arg His Gin 
115 120 125 

aag ate tat cac ttc aga gag ggt gat ttg att gca gtg cca ace ggt 432 
Lys lie Tyr His Phe Arg Glu Gly Asp Leu lie Ala Val Pro Thr Gly 
130 135 140 
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ttt gca tac tgg atg tac aac aat gaa gac act cct gtt gtt gcc gtt 480 
Phe Ala Tyx Trp Met Tyr Asn Asn Glu Asp Thr Pro Val Val Ala Val 
145 150 155 160 

tct ctt att gac acc aac age ttc cag aac cag etc gac cag atg cct 528 
Ser Leu lie Asp Tlir Asn Ser Ph.e Gin Asn Gin Leu Asp Gin Met Pro 
165 170 175 

agg aga ttc tat ctt get ggg aac caa gag caa gag ttt eta cag tat 576 
Arg Arg Plie Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe Leu Gin Tyr 
180 185 190 

cag cca cag aag cag caa gga ggt act caa age cag aaa gga aag cgt 624 
Gin Pro Gin Lys Gin Gin Gly Gly Tlxr Gin Ser Gin Lys Gly Lys Arg 
195 200 205 

cag caa gaa gaa gaa aac gaa gga ggc age ata ttg agt ggc ttc gcc 672 
Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser lie Leu Ser Gly Phe Ala 
210 215 220 

ccg gaa ttc ttg gaa cat gcg ttc gtc gtg gac agg cag ata gtg aga 720 
Pro Glu Phe Leu Glu His Ala Phe Val Val Asp Arg Gin lie Val Arg 
225 230 235 240 

aag eta caa ggt gag aac gaa gag gaa gag aag ggt gcc att gtg aca 768 
Lys Leu Gin Gly Glu Asn Glu Glu Glu Glu Lys Gly Ala lie Val Thr 
245 250 255 

gtg aaa gga ggt etc age gtg ata age cca ecc acg gaa gag cag caa 816 
Val Lys Gly Gly Leu Ser Val lie Ser Pro Pro Thr Glu Glu Gin Gin 
260 265 270 

caa aga ccc gag gaa gag gag aag cca gat tgt gac gag aaa gac aaa 864 
Gin Arg Pro Glu Glu Glu Glu Lys Pro Asp Cys Asp Glu Lys Asp Lys 

275 280 285 

cat tgc caa age caa age aga aat ggc att gac gag acc att tgc aca 912 
His Cys Gin Ser Gin Ser Arg Asn Gly lie Asp Glu Thr lie Cys Thr 

290 295 300 

atg aga ctt cgc cac aac att ggc cag act tea tea cct gac ate ttc 960 
Met Arg Leu Arg His Asn lie Gly Gin Thr Ser Ser Pro Asp lie Phe 
305 310 315 320 

aac cct caa get ggt age ate aca acc get acc age etc gac ttc cca 1008 
Asn Pro Gin Ala Gly Ser lie Thr Thr Ala Thr Ser Leu Asp Phe Pro 

325 330 335 

gcc etc teg tgg etc aaa etc agt gcc cag ttt gga tea etc cgc aag 1056 
Ala Leu Ser Trp Leu Lys Leu Ser Ala Gin Phe Gly Ser Leu Arg Lys 
340 345 350 

aat get atg ttc gtg cca cac tac aac ctg aac gca aac age ata ata 1104 
Asn Ala Met Phe Val Pro His Tyr Asn Leu Asn Ala Asn Ser lie lie 
355 360 365 

tac gca ttg aat gga egg gca ttg gta caa gtg gtg aat tgc aat ggt 1152 
Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val Asn Cys Asn Gly 

370 375 380 

gag aga gtg ttt gat gga gag ctg caa gag gga cag gtg tta att gtg 1200 
Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gin Val Leu He Val 
385 390 395 400 

cca caa aac ttt gcg gtg get gca aga tea cag age gac aac ttc gag 1248 
Pro Gin Asn Phe Ala Val Ala Ala Arg Ser Gin Ser Asp Asn Phe Glu 

405 410 415 
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tat gtt tea ttc aag acc aat gat aga ccc teg ate ggc aae ett gca 1296 
Tyr Val Ser Plie Lys Thr Asn Asp Arg Pro Ser lie Gly Asn Leu Ala 
420 425 430 

ggt gca aac tea ttg ttg aae gea ttg ccg gag gaa gtg att eag caa 1344 
Gly Ala Asn . Ser Leu Leu Asn Ala Leu Pro Glu Glu Val lie Gin Gin 
435 440 445 

act ttt aac eta agg agg cag cag gcc agg cag gtc aag aac aac aac 1392 
TOir Phe Asn Leu Arg Arg Gin Gin Ala Arg Gin Val Lys Asn Asn Asn 
450 455 460 

cct ttc age ttc ctg gtt cca cct aag gag tct eag agg aga gtt gtg 1440 
Pro Phe Ser Phe Leu Val Pro Pro Lys Glu Ser Gin Arg Arg Val Val 
465 470 475 480 

get tag 1446 
Ala 

<210> 28 

<211> 481 • 

<212> PRT 

<213> Glycine max 

<400> 28 

Met Ala Lys Leu Val Leu Ser Leu Cys Phe Leu Leu Phe Ser Gly Cys 
1 5 10 15 

Cys P3ae Ala Phe Ser Phe Arg Glu Gin Pro Gin Gin Asn Glu Cys Gin 
20 25 30 

He Gin Arg Leu Asn Ala Leu Lys Pro Asp Asn Arg He Glu Ser Glu 
35 40 45 

Gly Gly Phe He Glu Thr Trp Asn Pro Asn Asn Lys Pro Phe Gin Cys 
50 55 60 

Ala Gly Val Ala Leu Ser Arg Cys Thr Leu Asn Arg Asn Ala Leu Arg 
65 70 75 80 

Arg Pro Ser Tyr Thr Asn Ala Pro Gin Glu He Tyr He Gin Gin Gly 

85 90 95 

Ser Gly He Phe Gly Met He Phe Pro Gly Cys Pro Ser Thr Phe Glu 
100 105 110 

Glu Pro Gin Gin Lys Gly Gin Ser Ser Arg Pro Gin Asp Arg His Gin 
115 120 125 

Lys He Tyr His Phe Arg Glu Gly Asp Leu He Ala Val Pro Thr Gly 
130 135 140 

Phe Ala Tyr Trp Met Tyr Asn Asn Glu Asp Thr Pro Val Val Ala Val 
145 150 155 160 

Ser Leu He Asp Thr Asn Ser Phe Gin Asn Gin Leu Asp Gin Met Pro 

165 170 175 

Arg Arg Phe Tyr Leu Ala Gly Asn Gin Glu Gin Glu Phe Leu Gin Tyr 
180 185 190 

Gin Pro Gin Lys Gin Gin Gly Gly Thr Gin Ser Gin Lys Gly Lys Arg 
195 200 205 

Gin Gin Glu Glu Glu Asn Glu Gly Gly Ser He Leu Ser Gly Phe Ala 
210 215 220 

Pro Glu Phe Leu Glu His Ala Phe Val Val Asp Arg Gin He Val Arg 
225 230 235 240 
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Iiys Lieu Gin Gly Glu Asn Glu Glu Glu Glu Lys Gly Ala He Val Tiir 

245 250 255 

Val Lys Gly Gly Leu Ser Val He Ser Pro Pro Thr Glu Glu Gin Gin 
260 265 270 

Gin Arg Pro Glu Glu Glu Glu Lys Pro Asp Cys Asp Glu Lys Asp Lys 

275 280 285 

His Cys Gin Ser Gin Ser Arg Asn Gly lie Asp Glu Tlir He Cys Thx 
290 295 300 

Met Arg Leu Arg His Asn He Gly Gin Thr Ser Ser Pro Asp He Ph.e 
305 310 315 320 

Asn Pro Gin Ala Gly Ser He Thr Thr Ala Thr Ser Leu Asp Phe Pro 

325 330 335 

Ala Leu Ser Trp Leu Lys Leu Ser Ala Gin Phe Gly Ser Leu Arg Lys 
340 345 350 

Asn Ala Met Phe Val Pro His Tyr Asn Leu Asn Ala Asn Ser He He 
355 360 365 

Tyr Ala Leu Asn Gly Arg Ala Leu Val Gin Val Val Asn Cys Asn Gly 
370 375 380 

Glu Arg Val Phe Asp Gly Glu Leu Gin Glu Gly Gin Val Leu He Val 
385 390 395 400 

Pro Gin Asn Phe Ala Val Ala Ala Arg Ser Gin Ser Asp Asn Phe Glu 
405 410 415 

Tyr Val Ser Phe Lys Thr Asn Asp Arg Pro Ser He Gly Asn Leu Ala 
420 425 430 

Gly Ala Asn Ser Leu Leu Asn Ala Leu Pro Glu Glu Val He Gin Gin 
435 440 445 

Thr Phe Asn Leu Arg Arg Gin Gin Ala Arg Gin Val Lys Asn Asn Asn 
450 455 460 

Pro Phe Ser Phe Leu Val Pro Pro Lys Glu Ser Gin Arg Arg Val Val 
' 465 470 475 480 

Ala 



<210> 29 
<211> 1482 
<212> DNA 

<213> Helianthus annuus 

<220> 

<221> CDS 

<222> (1) - . (1479) 

<223> lis storage protein G3-D1 

<400> 29 

atg gca tec aaa gca act ttg etc 
Met Ala Ser Lys Ala Thr Leu Leu 
1 5 

act tgc att gcc cgc cac cag caa 
Thr Cys He Ala Arg His Gin Gin 
20 



tta get ttt acc ctt etc ttt gee 48 
Leu Ala Phe Thr Leu Leu Phe Ala 

10 15 

egg caa cag caa cag aac cag tgc 96 
Arg Gin Gin Gin Gin Asn Gin Cys 
25 30 
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cag ctt caa aac ate gag gcg etc gag ccc ate gaa gtt ate eaa get 144 
Gin Leu Gin Asn lie Glu Ala Leu Glu Pro lie Glu Val lie Gin Ala 
35 40 45 

gaa gee ggt gtg ace gaa att tgg gac gee tat gac caa cag ttc cag 192 
Glu Ala Gly Val Thr Glu lie Trp Asp Ala Tyr Asp Gin Gin Phe Gin 
50 55 60 

tgt gcg tgg teg att tta ttc gac ace gga ttc aac ctg gtg gee ttc 240 
Cys Ala Trp Ser He Leu Phe Asp Thr Gly Phe Asn Leu Val Ala Phe 
65 70 75 80 

tct tgc ctt cct aeg tea aea ccc eta ttt tgg ect teg teg aga gag 288 
Ser Cys Leu Pro Thr Ser Thr Pro Leu Phe Trp Pro Ser Ser Arg Glu 

85 90 95 

ggg gtt ata ttg ceg gga tgc egc aga ace tat gaa tat teg cag gag 336 
Gly Val He Leu Pro Gly Cys Arg Arg Thr Tyr Glu Tyr Ser Gin Glu 
100 105 110 

caa cag ttt tee ggt gag ggt gge egc aga gga gga gga gag gge aea 384 
Gin Gin Phe Ser Gly Glu Gly Gly Arg Arg Gly Gly Gly Glu Gly Thr 
115 120 ' 125 

ttc agg ace gtc ate aga aag tta gag aac tta aag gag ggt gac gtg 432 
Phe Arg Thr Val He Arg Lys Leu Glu Asn Leu Lys Glu Gly Asp Val 
130 135 140 

gtt gee ate ccc ace gga aea get cac tgg ctt eac aac gac gge aac 480 
Val Ala He Pro Thr Gly Thr Ala His Trp Leu His Asn Asp Gly Asn 
145 150 155 160 

aea gaa ctt gtg gtc gtc ttc ttg gat act cag aac cat gag aac cag 528 
Thr Glu Leu Val Val Val Phe Leu Asp Thr Gin Asn His Glu Asn Gin 

165 170 175 

ctt gac gaa aac eaa agg aga ttc ttc tta gee gga aac cct caa get 576 
Leu Asp Glu Asn Gin Arg Arg Phe Phe Leu Ala Gly Asn Pro Gin Ala 
180 185 190 

caa get eaa age cag cag eaa caa caa aga caa cea egc caa caa tct 624 
Gin Ala Gin Ser Gin Gin Gin Gin Gin Arg Gin Pro Arg Gin Gin Ser 
195 200 205 

cct caa agg caa agg eaa agg eaa agg eaa ggg caa ggt cag aac gee 672 
Pro Gin Arg Gin Arg Gin Arg Gin Arg Gin Gly Gin Gly Gin Asn Ala 
210 215 220 

.gge aac ate ttc aac ggt tte ace eee gag etc att gea eaa tea ttc 720 
Gly Asn He Phe Asn Gly Phe Thr Pro Glu Leu He Ala Gin Ser Phe 
225 230 235 240 

aac gtc gac caa gag acc gee cag aag eta caa gga caa aac gac cag 768 
Asn Val Asp Gin Glu - Thr Ala Gin Lys Leu Gin Gly Gin Asn Asp Gin 

245 250 255 

aga gge cac att gtt aat gtc gga eaa gac ctt caa ata gtc egc cea 816 
Arg Gly His lie Val Asn Val Gly Gin Asp Leu Gin He Val Arg Pro 
260 265 270 

cea eaa gac aga egc tct cct egc eaa eaa eaa gag caa gcg aeg tct 864 
Pro Gin Asp Arg Arg Ser Pro Arg Gin Gin Gin Glu Gin Ala Thr Ser 
275 280 285 

cct egc eaa caa eaa gag cag cag caa gge aga cgt gge gga tgg age 912 
Pro Arg Gin Gin Gin Glu Gin Gin Gin Gly Arg Arg Gly Gly Trp Ser 
290 295 300 
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aac ggt gtg gaa gaa acc ate tgc age atg aag tte aaa gtg aae att 960- 
Asn Gly Val Glu Glu Thr He Cys Ser Met Lys Plie Lys Val Asn He 
305 310 315 320 

gac aae cct tec eag get gac ttt gta aae ccg caa gee ggc age att 1008 
Asp Asn Pro Ser Gin Ala Asp Phe Val Asn Pro Gin Ala Gly Ser He 
325 330 335 

gca aac etc aac age tte aaa tte ccc att etc gag cac etc egg etc 1056 
Ala Asn Leu Asn Ser Phe Lys Plie Pro He Leu Glu His Leu Arg Leu 
340 345 350 

age gtg gaa aga ggc gaa etc cgt ccg aat gee ate caa tec cca cac 1104 
Ser Val Glu Arg Gly Glu Leu Arg Pro Asn Ala He Gin Ser Pro His 
355 . 360 365 

tgg aca ate aac gee cac aat ett etc tac gta ace gag gga gee ttg 1152 
Trp Thr He Asn Ala His Asn Leu Leu Tyr Val Thr Glu Gly Ala Leu 
370 375 380 

agg gta caa ate gtc gac aae caa gga aae tea gtt tte gac aae gag 1200 
Arg Val Gin He Val Asp Asn Gin Gly Asn Ser Val Phe Asp Asn Glu 
385 390 395 400 

etc cgt gag gga eag gtg gtg gtg ate ccg cag aac ttt gcg gtg . ate 1248 
Leu Arg Glu Gly Gin Val Val Val lie Pro Gin Asn Phe Ala Val He 
405 410 415 

aag aga gee aat gaa caa gga age agg tgg gtg tct tte aag act aat 1296 
Lys Arg Ala Asn Glu Gin Gly Ser Arg Trp Val Ser Phe Lys Thr Asn 
420 425 430 

gat aat gee atg ata gca aac ett gca ggg cgt gtg tee gca tea gca 1344 
Asp Asn Ala Met He Ala Asn Leu Ala Gly Arg Val Ser Ala Ser Ala 
435 440 445 

gca teg ccg ttg aeg ttg tgg gcg aat egg tat eag eta tct cga gag 1392 
Ala Ser Pro Leu Thr Leu Trp Ala Asn Arg Ty^r Gin Leu Ser Arg Glu 
450 455 460 

gaa get cag cag etc aag ttt age cag agg gag acg gtt ttg ttt gca 1440 
Glu Ala Gin Gin Leu Lys Phe Ser Gin Arg Glu Thr Val Leu Phe Ala 
465 470 475 480 

cca agt ttt tec agg ggc caa ggg ate agg get tea cgt taa 1482 
Pro Ser Phe Ser Arg Gly Gin Gly He Arg Ala Ser Arg 
485 490 

<210> 30 
<211> 493 
<212> PRT 

<213> Helianthus annuus 
<400> 30 

Met Ala Ser Lys Ala Thr Leu Leu Leu Ala Phe Thr Leu Leu Phe Ala 
1 5 10 15 

Thr Cys He Ala Arg His Gin Gin Arg Gin Gin Gin Gin Asn Gin Cys 
20 25 30 

Gin Leu Gin Asn He Glu Ala Leu Glu Pro He Glu Val He Gin Ala 

35 40 45 

Glu Ala Gly Val Thr Glu He Trp Asp Ala Tyr Asp Gin Gin Phe Gin 
50 55 60 

Cys Ala Trp Ser He Leu Phe Asp Thr Gly Phe Asn Leu Val Ala Phe 
65 70 75 80 
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Ser Cys Leu Pro Thr Ser Tlir Pro Leu Phe Trp Pro Ser Ser Arg Glu 

85 90 95 

Gly Val lie Leu Pro Gly Cys Arg Arg Thr. Tyr Glu Tyr Ser Gin Glu 
100 105 110 

Gin Gin Phe Ser Gly Glu Gly Gly Arg Arg Gly Gly Gly Glu Gly Thr 

115 120 125 

Phe Arg Thr Val lie Arg Lys Leu Glu Asn Leu Lys Glu Gly Asp Val 
130 135 140 

Val Ala lie Pro Thr Gly Thr Ala His Trp Leu . His Asn Asp Gly Asn 
145 150 155 160 

Thr Glu Leu Val Val Val Phe Leu Asp Thr Gin Asn His Glu Asn Gin 
165 170 175 

Leu Asp Glu Asn Gin Arg Arg Phe Phe Leu Ala Gly Asn Pro Gin Ala 

180 185 . 190 

Gin Ala Gin Ser Gin Gin Gin Gin Gin Arg Gin Pro Arg Gin Gin Ser 
195 200 205 

Pro Gin Arg Gin Arg Gin Arg Gin Arg Gin Gly Gin Gly Gin Asn Ala 
210 215 220 

Gly Asn lie Phe Asn Gly Phe Thr Pro Glu Leu lie Ala Gin Ser Phe 
225 230 235 240 

Asn Val Asp Gin Glu Thr Ala Gin Lys Leu Glri Gly Gin Asn Asp Gin 
245 250 255 

Arg Gly His He Val Asn Val Gly Gin Asp Leu Gin He Val Arg Pro 
260 265 270 

Pro Gin Asp Arg Arg Ser Pro Arg Gin Gin Gin Glu Gin Ala Thr Ser 
275 280 285 

Pro Arg Gin Gin Gin Glu Gin Gin Gin Gly Arg Arg Gly Gly Trp Ser 

290 295 300 

Asn Gly Val Glu Glu Thr He Cys Ser Met Lys Phe Lys Val Asn He 
305 310 315 320 

Asp Asn Pro Ser Gin Ala Asp Phe Val Asn Pro Gin Ala Gly Ser He 
325 330 335 

Ala Asn Leu Asn Ser Phe Lys Phe Pro He Leu Glu His Leu Arg Leu 
340 345 350 

Ser Val Glu Arg Gly Glu Leu Arg Pro Asn Ala He Gin Ser Pro His 

355 360 365 

Trp Thr He Asn Ala His Asn Leu Leu Tyr Val. Thr Glu Gly Ala Leu 
370 375 380 

Arg Val Gin He Val Asp Asn Gin Gly Asn Ser Val Phe Asp Asn Glu 
385 390 395 400 

Leu Arg Glu Gly Gin Val Val Val He Pro Gin Asn Phe Ala Val He 
405 410 415 

Lys Arg Ala Asn Glu Gin Gly Ser Arg Trp Val Ser Phe Lys Thr Asn 
420 425 430 

Asp Asn Ala Met He Ala Asn Leu Ala Gly Arg Val Ser Ala Ser Ala 
435 440 445 

Ala Ser Pro Leu Thr Leu Trp Ala Asn Arg Tyr Gin Leu Ser Arg Glu 
450 455 460 
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Glu Ala Gin Gin Leu Lys Phe Ser Gin Arg Glu Thr Val Leu Plie Ala 
465 470 475 480 

Pro Ser Phe Ser Arg Gly Gin Gly He Arg Ala Ser Arg 
485 490 

<210> 31 
<211> 537 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (1) . . (534) 

<223> NAPIN 

<400> 31 

atg gcg aac aag etc ttc etc gtc teg gca act etc gee ttc ttc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 . 10 15 

ctt etc acc aat gee tec ate tac egg aeg gtc gtc gag ttc gac gaa 96 
Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gat gee aca gac tea gee ggc cca ttt agg att cca aaa tgt agg * 144 
Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg He Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac eta aga get tge cag eag tgg etc - 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Tip Leu 
50 55 60 

cac aag caa gca atg cag tet ggc ggt ggt cct age tgg acc etc gac 240 
His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

ggt gag ttt gac ttt gaa gac gac atg gag aac ccg cag ggt cca cag 288 
Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 

85 90 95 

cag aga ccg cct eta etc cag eag tge tgt aac gag etc cac cag gaa 336 
Gin Tirg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

gag ecc ctt tge gtt tge cca acc ttg aaa gga gca tec aaa gcg gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

aaa caa caa att caa caa eag gga caa cag caa gga aag cag caa atg 432 
Lys Gin Gin He Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

gtg age cgt ate tac cag acc get aeg cac tta cct aaa gtt tge aac 480 
Val Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

ate ccg caa gtt age gtt tgt ecc ttc cag aag acc atg cct ggg cce 528 
He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

tec tac tag 537 
Ser Tyr 

<210> 32 . 
<211> 178 
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<212> PRT 

<213> Brassica napus 
<400> 32 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Leu Ala Phe Phe Phe 

15 10 15 

Leu Leu Thx Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg lie Pro Lys Cys Arg 
35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 

85 ■ 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 

115 120 125 

Lys Gin Gin lie Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

Val Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

Ser Tyr 



<210> 33 
<211> 537 
<212> DNA 

<213> Brassica juncea 

<220> 

<221> CDS 

<222> (1) . . (534) 

<223> 2S storage protein 

<400> 33 

atg gcg aac aag etc ttc etc gtc teg gca act etc gee ttc ttc ttc 48 
Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10 15 

ctt etc ace aat gee tec ate tac egg aeg gtc gtc gag ttc gae gaa 96 
Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gat gee aca gac tea gee gge cea ttt agg att cea aaa tgt agg 144 
Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg He Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac eta aga gtc tgc cag cag tgg etc 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Arg Val Cys Gin Gin Txp Leu 
50 55 60 
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cac aag caa gca atg cag tct ggc ggt ggt etc age tgg acc etc gae 240 
His Lys Gin Ala Met Gin Ser Gly Gly Gly Leu Ser Trp Thr Leu Asp 
65 70 75 80 

ggt gag ttt gae ttt gaa gae gac atg gag aae teg cag ggt eea cag 288 
Gly Glu Pile Asp Phe Glu Asp Asp Met Glu Asn Ser Gin Gly Pro Gin 

85 90 95 

cag aga ccg cct eta etc cag cag tgc tgt aac gag etc cac cag gaa 336 
Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

gag ecc ctt tgc gtt tgc eca acc ttg aaa gga gca tec aaa gcg gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 

115 120 125 

aaa caa caa att caa caa cag gga caa cag caa gga aag cag caa atg 432 
Lys Gin Gin lie Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

gtg age cgt ate tac cag acc get acg cac tta cct aaa gtt tgc aac 480 
Val Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

ate ccg caa gtt age gtt tgt ecc ttc cag aag acc atg cct .ggg ecc 52 8 
lie Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

tee tac tag. 537 
Ser Tyr 

<210> 34 
<211> 178 
<212> PRT 

<213> Brassica jimcea 
<400> 34 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 5 10 15 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala Thr Asp Ser Ala Gly Pro Phe Arg lie Pro Lys Cys Arg 

35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Arg Val Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Gly Gly Leu Ser Trp Thr Leu Asp 
65 70 75 80 

Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Ser Gin Gly Pro Gin 

85 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Lys Gin Gin lie Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
' 130 135 140 

Val Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 
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<210> 35 
<211> 537 
<212> DNA 

<213> Brass ica oleracea 

<220> 

<221> CDS 

<222> (1)..(534) 

<223> 2S storage protein 

<400> 35 

atg gcg aac aag etc ttc etc gtc teg gea act etc gee ttc ttc ttc 48 
Met Ala Asn Lys Leu Phe Leu Val Ser Ala I*hr Leu Ala Phe Phe Phe 
1 5 10 • 15 

ctt etc acc aat gee tec ate tac egg acg gtg gtc gag ttc gac gaa 96 
Leu Leu Thr Asn Ala Ser lie Tyr Arg Thr Val Val Glu Phe Asp Glu 
20 25 30 

gat gat gcc aca aac cca gee ggc eca ttt agg ate eca aaa tgt agg 144 
Asp Asp Ala Thx Asn Pro Ala Gly Pro Phe Arg . lie Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac eta aga get tgc cag cag tgg etc 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 .55 60 

cac aag caa gca atg cag tet ggc ggt ggt cet age tgg acc etc gac 240 
His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

agt gag ttt gac ttt gaa gac gac atg gag aac ceg cag ggt cca cag 288 
Ser Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 

85 90 95 

cag aga ceg cet eta etc etg caa tgc tgt aac gag ctg gac cag gaa 336 
Gin Arg Pr6 Pro Leu Leu Leu Gin Cys Cys Asn Glu Leu Asp Gin Glu 
100 105 110 

gag ccc ctt tgc gtt tgc cca acc ttg aaa gga gca tec aaa gcg gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

aaa caa caa att caa caa cag gga caa cag caa gga aag cag caa atg 432 
Lys Gin Gin lie Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

gtg age cgt ate tac cag acc get acg cac tta cet aaa gtt tgc aac 480 
Val Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

ate ceg caa gtt age gtt tgt ccc ttc cag aag acc atg cet ggg ccc 528 
lie Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

tec tac tag 537 
Ser Tyr 

<210> 36 
<211> 178 
<212> PRT 

<213> Brass ica oleracea 



BNSOOCID: <WO ^0307B62eiA1J_> 



wo 03/078629 PCT/EP03/02735 

47 

<400> 36 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
15 10 15 

Leu Leu Thr Asn Ala Ser lie Tyr Arg Thx Val Val Glu Phe Asp Glu 
20 25 30 

Asp Asp Ala ThLr Asn Pro Ala Gly Pro PHe Arg He Pro Lys Cys Arg 
35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Gly Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

Ser Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 

85 90 95 

Gin Arg Pro Pro Leu Leu Leu Gin Cys Cys Asn Glu Leu Asp Gin Glu 
100 105 110 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Lys Gin Gin He Gin Gin Gin Gly Gin Gin Gin Gly Lys Gin Gin Met 
130 135 140 

Val Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
145 150 155 160 

He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

Ser Tyr 



<210> 37 
<211> 543 
<212> DNA 

<213> Brassica napus cv. Topas 

<220> 
<221> CDS 
<222> (1)..(540) 
<223> Napin 

<400> 37 

atg gcg aac aag etc ttc etc gtc teg gca act ctt gee ttc ttc ttc 48 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
15 10 15 

ctt etc ace aac gee tec ate tac egc ace ate gtg gaa gtc gae gaa 9 6 
Leu Leu Thr Asn Ala Ser He Tyr Arg Thr He Val Glu Val Asp Glu 
20 25 30 

gat gat gcc aca aac cca gcc ggc eca ttt agg att cca aaa tgt agg 144 
Asp Asp Ala Thr Asn Pro Ala Gly Pro Phe Arg He Pro Lys Cys Arg 
35 40 45 

aag gag ttt cag caa gca caa cac ctg aaa get tge caa caa tgg etc 192 
Lys Glu Phe Gin Gin Ala Gin His Leu Lys Ala Cys Gin Gin Trp Leu 
50 55 60 

cac aag cag gca atg cag tec ggt agt ggc cca age tgg ace etc gae 240 
His Lys Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 
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ggt gag ttt gat ttt gaa gat gac atg gag aac ccc cag ggc cca caa 288 
Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 

85 90 95 . 

cag agg ccg cca eta etc cag cag tgc tgc aac gag etc cac cag gaa 336 
Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 .110 

gag cca ctt tgc gtt tgc cca acc ttg aaa gga gca tec aaa gee gtt 384 
Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 

115 120 125 

aaa caa cag gtt ega caa cag caa gga cag cag gga cag cag ctg cag 432 
Lys Gin Gin Val Arg Gin Gin Gin Gly Gin Gin Gly Gin Gin Leu Gin 
130 135 140 

caa gta att age egt ate tac cag act get acg cac tta cet aaa gtt 480 
Gin Val He Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val 
145 150 155 160 

tgc aac ate ccg caa gtt age gtt tgt ccc ttc cag aag acc atg cet 528 
Cys Asn He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro 
165 170 175 

gga ccc tec tac tag 543 
Gly Pro Ser Tyr 
180 

<210> 38 
<211>' 180 
<212> PRT 

<213> Brass ica napus cv. Topas 
<400> 38 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 
1 ■ 5 10 . 15 

Leu Leu Thr- Asn Ala Ser He Tyr Arg Thr He Val Glu Val Asp Glu 

20 25 30 

Asp Asp'- Ala Thr Asn Pro Ala Gly Pro Phe Arg He Pro Lys Cys Arg 
35 40 45 

Lys Glu Phe Gin Gin Ala Gin His Leu Lys Ala Cys Gin Gin Trp Leu 
50 55 60 

His Lys Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin 

85 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Pro Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Lys Gin Gin Val Arg Gin Gin Gin Gly Gin Gin Gly Gin Gin Leu Gin 
130 135 140 

Gin Val He Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Lys Val 
145 150 155 160 

Cys Asn He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro 

165 170 175 

Gly Pro Ser Tyr 
180 
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<210> 39 

<211> 435 

<212> DNA 

<213> Sinapis alba 

<220> 

<221> CDS 

<222> (1) , . (432) 

<223> coding for partial sinl storage protein 
<400> 39 

cca gcc ggc cca ttt ggg att cca aaa tgt agg aag gag ttt caa caa 48 
Pro Ala Gly Pro Phe Gly lie Pro Lys Cys Arg Lys Glu Phe Gin Gin 
15 10 15 

gca caa cac eta aga get tgc eag caa tgg etc cac aag cag gca atg 96 
Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 
20 25 30 

cag tct ggt agt ggt cca age tgg acc etc gac gat gag ttt gat ttt 144 
Gin Ser Gly Ser Gly Pro Ser Trp Tlar Leu Asp Asp Glu Phe Asp Phe 
35 40 45 

gaa gat gac atg gag aac cca cag gga cca cag cag agg cca cca eta 192 
Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Arg Pro Pro Leu 
50 55 60 

etc cag cag tgc tgc aac gag etc cac cag gaa gag cca ctt tgc gtt 240 
Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu Glu Pro Leu Cys Val 
65 70 75 80 

tgc cca acc ttg aaa gga gca tec aaa gcc gtt aaa eag cag gtt aga 288 
Cys Pro Thx Leu Lys Gly Ala Ser Lys Ala Val Lys Gin Gin Val Arg 

85 90 95 

caa cag ctg gag cag cag gga cag eag gga ecg cac ctg eag cat gta 336 
Gin Gin Leu Glu Gin Gin Gly Gin Gin Gly Pro His Leu Gin His Val 
100 105 110 

att age cgt ate tac cag acc get aeg cac tta cct aga gtt tgc aac 384 
He Ser Arg He Tyr Gin Thr Ala Ttu: His Leu Pro Arg Val Cys Asn 
115 120 125 

att agg caa gtt age gtt tgt eee tte cag aag ace atg cct gga ccc 432 
He Arg Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
130 135 140 



tec 

<210> 40 

<211> 144 

<212> PRT 

<213> Sinapis alba 

<400> 40 

Pro Ala Gly Pro Pbe Gly He Pro Lys Cys Arg Lys Glu Pbe Gin Gin 
15 10 15 

Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 

20 25 30 

Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp Asp Glu Phe Asp Phe 
35 40 45 

Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Arg Pro Pro Leu 
50 55 60 



435 
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Leu Gin Gin Cys Cys Asn Glu Leu 
65 70 

Cys P3ro Thr Leu Lys Gly Ala Ser 

85 

Gin Gin Leu Glu Gin Gin Gly Gin 
100 

lie Ser Arg lie Tyr Gin Tlir Ala 
115 120 

lie Arg Gin Val Ser Val Cys Pro 
130 135 
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50 

His Gin Glu Glu Pro Leu Cys Val 
75 80 

Lys Ala Val Lys Gin Gin Val Arg 
90 95 

Gin Gly Pro His Leu Gin His Val 
105 110 

Thr His Leu Pro Arg Val Cys Asn 
125 

Phe Gin Lys Thr Met Pro Gly Pro 
140 



<210> 41 

<211> 468 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (465) 

<223> 2S albumine 1 

<400> 41 

atg acc aag ctt aca att etc etc ate get ctt etc ttc ate gee cae 48 

Met Thr Lys Leu Thr He Leu Leu He Ala Leu Leu Phe He Ala His 
15 10 15 

acc tgc tgc gcc tec aaa tgg caa cag cae cag caa gag age tgc cgc 96 
Thr Cys Cys Ala Ser Lys Trp Gin Gin His Gin Gin Glu Ser Cys Arg 
20 25 30 

gag cag etc aag ggg .ate aac etc aac cec tgt gag cae ate atg gag 144 
Glu Gin Leu Lys Gly He Asn Leu Asn Pro Cys Glu His He Met Glu 
35 40 ' 45 

aag ate caa get gge cgc cgc gge gag gae ggc age gae gaa gat cae 192 
Lys He Gin Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp Glu Asp His 
50 55 60 

att etc ate agg acc atg ceg gga aga ate aac tac ate agg aag aag 240 
He Leu He Arg Thr Met Pro Gly Arg He Asn Tyr He Arg Lys Lys 
65 70 75 80 

gaa gga aaa gaa gaa gaa gaa gaa gga cac atg cag aag tgc tgc age 288 
Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gin Lys Cys Cys Ser 

85 90 95 

gaa atg age gag etg aaa age cec at a tgc cag tgc aaa gcg eta cag 336 
Glu Met Ser Glu Leu Lys Ser Pro He Cys Gin Cys Lys Ala Leu Gin 
100 105 110 

aag ata atg gat aac eag age gag caa etg gag ggg aag gag aag aag 384 
Lys He Met Asp Asn Gin Ser Glu Gin Leu Glu Gly Lys Glu Lys Lys 

115 120 125 

eag atg gag aga gag etc atg aac ttg get att agg tgc agg ttg gga 432 
Gin Met Glu Arg Glu Leu Met Asn Leu Ala He Arg Cys Arg Leu Gly 
130 135 140 

cec atg ata ggg tgc gae ttg tee tec gat gae tga 468 
Pro Met He Gly Cys Asp Leu Ser Ser Asp Asp 
145 150 155 
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<210> 42 

<211> 155 

<212> PRT 

<213> Glycine max 

<400> 42 

Met Ttnc Lys Leu Thr He Leu Leu He Ala Leu Leu Phe He Ala His 
15 10 15 

Thr Cys Cys Ala Ser Lys Trp Gin Gin His Gin Gin Glu Ser Cys Arg 

20 25 30 

Glu Gin Leu Lys Gly He Asn Leu Asn Pro Cys Glu His He Met Glu 
35 40 45 

Lys He Gin Ala Gly Arg Arg Gly Glu Asp Gly Ser Asp Glu Asp His 
50 55 60 

He Leu He Arg Thr Met Pro Gly Arg He Asn Tyr He Arg Lys Lys 
S5 70 75 80 

Glu Gly Lys Glu Glu Glu Glu Glu Gly His Met Gin Lys Cys Cys Ser 

85 90 95 

Glu Met Ser Glu Leu Lys Ser Pro He Cys Gin Cys Lys Ala Leu Gin 
100 105 110 

Lys He Met Asp Asn Gin Ser Glu Gin Leu Glu Gly Lys Glu Lys Lys 

115 120 125 

Gin Met Glu Arg Glu Leu Met Asn Leu Ala He Arg Cys Arg Leu Gly 
130 135 140 

Pro Met He Gly Cys Asp Leu Ser Ser Asp Asp 
145 150 155 



<210> 43 

<211> 477 

<212> DMA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1)..{474) 

<223> 2S albumine 

btc aca ate etc etc ate tct ett etc ttc tgc ate gee 48 
Phe Thr He Leu Leu He Ser Leu Leu Phe Cys He Ala 
5 10 15 

age gee tec aaa tgg cag eac cag caa gat age tgc cgc 96 
Ser Ala Ser Lys Trp Gin His Gin Gin Asp Ser Cys Arg 
20 25 ' 30 

=ag ggg gtg aac etc acg ccc tgc grag aag cac ate atg 144 
51n Gly Val Asn Leu Thr Pro Cys Glu Lys His He Met 

40 45 

::aa ggc cgc ggc gat gac gat gat gat gat gac gac gae 192 
31n Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp 
55 60 

:tc agg ace atg egg gga aga ate aac tac ata agg agg 240 
jeu Arg Thr Met Arg Gly Arg He Asn Tyr He Arg Arg 
65 70 75 80 



<400> 43 


atg 


ace 


aag 


Met 


Thr 


Lys 


1 






eac 


act 


tgc 


His 


Thr 


Cys 


aag 


cag 


etc 


Lys 


Gin 


Leu 






35 


gag 


aag 


ate 


Glu 


Lys 


He 




50 




aat 


eac 


att 


Asn 


His 


He 
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aac gaa gga aaa gac gaa'gac gaa gaa gaa gaa gga cac atg cag aag 288 

Asn Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly His Met Gin Lys 

85 90 95 

tgc tgc aca gaa atg age gag ctg aga age ccc aaa tgc cag tgc aaa 336 
Cys Cys Thr Glu Met Ser Glu Leu Arg Ser Pro Lys Cys Gin Cys Lys 
100 105 110 

gcg ctg cag aag ata atg gag aac cag age gag gaa ctg gag gag aag 384 
Ala Leu Gin Lys lie Met Glu Asn Gin Ser Glu Glu Leu Glu Glu Lys 

115 120 125 

cag aag aag aaa atg gag aag gag etc att aac ttg get act atg tgc 432 
Gin Lys Lys Lys Met Glu Lys Glu Leu He Asn Leu Ala Thr Met Cys 
130 135 140 

agg ttt gga ccc atg ate cag tgc gac ttg tee tee gat gae taa 477 
Arg Phe Gly Pro Met He Gin Cys Asp Leu Ser Ser Asp Asp 
145 150 155 

<210> 44 

<211> 158 

<212> PRT 

<213> Glycine max 

<400> 44 

Met Thr Lys Phe Thr He Leu Leu He Ser Leu Leu Phe Cys He Ala 
1 5 10 15 

His Thr Cys Ser Ala Ser Lys Trp Gin His Gin Gin Asp Ser Cys Arg 
20 25 30 

Lys Gin Leu Gin Gly Val Asn Leu Thr Pro Cys Glu Lys His He Met 
35 40 . 45 - 

Glu Lys He Gin Gly Arg Gly Asp Asp Asp Asp Asp Asp Asp Asp Asp 
50 55 60 

Asn His He Leu Arg Thr Met Arg Gly Arg He Asn Tyr He Arg Arg 
65 70 75 80 

Asn Glu Gly Lys Asp Glu Asp Glu Glu Glu Glu Gly His Met Gin Lys 

85 90 95 

Cys Cys Thr Glu Met Ser Glu Leu Arg Ser Pro Lys Cys Gin Cys Lys 
100 105 110 

Ala Leu Gin Lys He Met Glu Asn Gin Ser Glu Glu Leu Glu Glu Lys 
115 120 125 

Gin Lys Lys Lys Met Glu Lys Glu Leu He Asn Leu Ala Thr Met Cys 
130 135 140 

Arg Phe Gly Pro Met He Gin Cys Asp Leu Ser Ser Asp Asp 
145 150 155 

<210> 45 
<211> 537 
<212> DNA 

<213> Brassica nigra 

<220> 

<221> CDS 

<222> (1) . . (534) 

<223> 2S storage protein 
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<400> 45 

atg gcg aac aag etc ttc etc gtc teg gca act etc gee ttc ttc tte 48 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Tlir Leu Ala Phe Phe Phe 

15 10 15 

ctg etc aee aat gee tee ate tae egg acg gtc gtc gag ttc gac gaa 96 

Leu Leu Thr Asn Ala Ser lie Tyr Arg T33x Val Val Glu Phe Asp Glu 

20 25 30 

gat gat gac aca aac caa gee gga cca ttt agg att cca aga tgt cga 144 

Asp Asp Asp Thr Asn Gin Ala Gly Pro Phe Arg lie Pro Arg cys Arg 
35 40 45 

aag gag ttt egg caa gca caa eat eta aga get tgc cag caa tgg etc 192 
Lys Glu Phe Arg Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

cac agg cag gca atg cag tee ggt agt ggt cca age tgg acc ctg gac 240 
His Arg Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Trp Thr Leu Asp 
65 70 75 80 

ggt gag ttt gac ttt gaa gac gac atg gag aac caa eag gge cca eag 288 
Gly Glu Phe Asp Phe Glu Asp Asp Met Glu Asn Gin Gin Gly Pro Gin 

85 90 ■ 95 ' • 

cag agg cca cct eta etc cag caa tgc tgc aac gag etc cac eag gaa 3 36 
Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 

100 105 110 

gag gca ctt tgt gtt tgc cca ace ttg aaa gga gca tec aaa gcg gtt 
Glu Ala Leu Cys Val Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

aga caa cag gtt cga caa cag gga cac cag eag cag atg eag cat gta 
Arg Gin Gin Val Arg Gin Gin Gly His Gin Gin Gin Met Gin His Val 
130 135 140 

att age cgt ate tae eag aee get acg cac tta cct aga gtt tgc aac 
He Ser Arg He Tyr Gin Thr Ala Thr His Leu Pro Arg Val Cys Asn 

150 155 160 

ate ecg caa gtt age gtt tgt ccc ttc cag aag ace atg cct ggg cec 
He Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro- Gly Pro 

165 170 175 

tec tae tag 53.^ 
Ser Tyr 

<210> 46 
<211> 178 
<212> PRT 

<213> Brassica nigra 
<400> 46 

Met Ala Asn Lys Leu Phe Leu Val Ser Ala Thr Leu Ala Phe Phe Phe 

1 5 10 15 

Leu Leu Thr Asn Ala Ser He Tyr Arg Thr Val Val Glu Phe Asp Glu 

20 25 30 

Asp Asp Asp Thr Asn Gin Ala Gly Pro Phe Arg Xle Pro Arg Cys Arg 
35 40 45 

Lys Glu Phe Arg Gin Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu 
50 55 60 

His Arg Gin Ala Met Gin Ser Gly Ser Gly Pro Ser Trp ^Thr Leu Asp 
65 70 75 80 



3 84 



432 



480 



528 
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Gly Glu Pile Asp Phe Glu Asp Asp Met Glu Asn Gin Gin Gly Pro Gin 

85 90 95 

Gin Arg Pro Pro Leu Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu 
100 105 110 

Glu Ala Leu Cys Val Cys Pro Tlir Leu Lys Gly Ala Ser Lys Ala Val 
115 120 125 

Arg Gin Gin Val Arg Gin Gin Gly His Gin Gin Gin Met Gin His Val 
130 135 140 

lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Arg Val Cys Asn 
145 150 155 160 

lie Pro Gin Val Ser Val Cys Pro Phe Gin Lys Thr Met Pro Gly Pro 
165 170 175 

Ser Tyr 



<210> 47 
<211> 435 
<212> DNA 

<213> Sinapis alba 

<220> 

<221> CDS 

<222> (1) . . (432) 

<223> sin5 storage protein 

<400> 47 

cca gcc ggc cca ttt ggg att cca aaa tgt agg aag gag ttt caa caa 48 

Pro Ala Gly Pro Plie Gly lie Pro Lys Cys Arg Lys Glu Phe Gin Gin 
15 10 15 

gca caa cac eta aga get tge cag caa tgg etc cac aag cag gea atg 96 
Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 
20 25 30 

cag tct ggt agt ggt cca age tgg ace etc gae gat gag ttt gat ttt 144 
Gin Ser Gly Ser Gly Pro Ser Trp Tlir Leu Asp Asp Glu Phe Asp Phe 
35 40 45 

gaa- gac gac atg gag aac cec cag gga cca cag cag aag ccg cca eta 192 
Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Lys Pro Pro Leu 
50 ' ■ ' 55 60 

etc cag caa tge tgc aac gag ctt cac cag gag gag cca ctt tgc gtt 240 
Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu Glu Pro Leu Gys Val 
65 70 75 80 

tgc cca act ttg aaa gga get tec aaa gee gtt aaa caa cag gtt ega 288 
Cys Pro Thr Leu Lys Gly Ala Ser Lys Ala Val Lys Gin Gin. Val Arg 

85 90 95 

caa cag ttg ggg cag cag gga cag cag gga ccg cag gtg cag cat gta 33 6 
Gin Gin Leu Gly Gin Gin Gly Gin Gin Gly Pro Gin Val Gin His Val 
100 105 110 

att age egt ate tac cag acc get acg cac tta cet aaa gtt tge aac 3 84 
lie Ser Arg lie Tyr Gin Thr Ala Thr His Leu Pro Lys Val Cys Asn 
115 120 125 

ate cec caa gta age gtt tgt ccc ttc aag aag acc atg cet gga cec 432 
lie Pro Gin Val Ser Val Cys Pro Phe Lys Lys Thr Met Pro Gly Pro 
130 ' 135 140 
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tec 



<210> 48 
<211> 144 
<212> PRT 

<213> Sinapis alba 
<400> 48 

Pro Ala Gly Pro Phe Gly lie Pro Lys Cys Arg Lys Glu Phe Gin Gin 
15 10 15 

Ala Gin His Leu Arg Ala Cys Gin Gin Trp Leu His Lys Gin Ala Met 
20 25 30 

Gin Ser Gly Ser Gly Pro Ser Trp Tiir Leu Asp Asp Glu Piie Asp Phe 
35 40 45 

Glu Asp Asp Met Glu Asn Pro Gin Gly Pro Gin Gin Lys Pro Pro Leu 
50 55 60 

Leu Gin Gin Cys Cys Asn Glu Leu His Gin Glu Glu Pro Leu Cys Val 
65 70 75 80 

Cys Pro Tlir Leu Lys Gly Ala Ser Lys Ala Val Lys Gin Gin Val Arg 

85 90 95 

Gin Gin Leu Gly Gin Gin Gly Gin Gin Gly Pro Gin Val Gin His Val 
100 105 110 

He Ser Arg He' Tyr Gin Thr Ala Tlir His Leu Pro Lys Val Cys Asn 
115 120 125 

He Pro Gin Val Ser Val Cys Pro Phe Lys Lys Thr Met Pro Gly Pro 
130 135 140 



435 



<210> 49 
<211> 888 
<212> DNA 

<213> Helianthus annuus 

<220> 

<221> CDS 

<222> (1)..(885) 

<223> HaG5 2S albimiine 

<400> 49 

atg gca aag caa ata gtt etc gca etc get ttc gee gee ctt gta gee 48 

Met Ala Lys Gin He Val Leu Ala Leu Ala Phe Ala Ala Leu Val Ala 
15 10 15 

ttt get acc gee cac aca ace ata ate ace acc ace ate gaa gac gag 9 6 
Phe Ala Thr Ala His Thr Thr He He Thr Thr Thr He Glu Asp Glu 
20 25 30 

aac ccg ate tec gga caa agg caa gtg age caa egg ata eag gga caa 144 
Asn Pro He Ser Gly Gin Arg Gin Val Ser Gin Arg He Gin Gly Gin 
35 40 45 

agg ctg aac eag tgt egc atg ttc etc eag eag ggt eag aac att cct 192 
Arg Leu Asn Gin Cys Arg Met Phe Leu Gin Gin Gly Gin Asn He Pro 
50 55 60 

cgc gaa ttc gat aac cct bag atg ggg egg eag eag gag eag eag etc 240 
Arg Glu Phe Asp Asn Pro Gin Met Gly Arg Gin Gin Glu Gin Gin Leu 
65 70 75 80 
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cag cag tgt tgt caa gag etc caa aac ate gaa ggg cag tgc caa tgt 288 
Gin Gin Cys Cys Gin Glu Leu Gin Asn lie Glu Gly Gin Cys Gin Cys 

85 ' 90 .95 

gag gcg gtg aag cag gtg ttc cga gaa gcc cag cag caa gta caa cag 33 6 
Glu Ala Val Lys Gin Val Phe Arg Glu Ala Gin Gin Gin Val Gin Gin 
100 105 110 

caa cag gga egg cag ctt gta ccc ttc cgc ggt teg cag cag acc caa 3 84 
Gin Gin Gly Arg Gin Leu Val Pro Plie Arg Gly Ser Gin Gin Thr Gin 

115 120 125 

cag ttg aag cag aag get cag att etc ect aac gta tgc aac ctt caa 432 
Gin Leu Lys Gin Lys Ala Gin lie Leu Pro Asn Val Cys Asn Leu Gin 
130 135 140 

tea aga cga tgt gaa ate gga acc ate acc acc acc gtc ace gag age 480 
Ser Arg Arg Cys Glu lie Gly Thr He Thr Thr Thr Val Thr Glu Ser 
145 150 155 160 

aat ate gat ate ccc ttc egt gae agg ccc ttt ggc act gga tea caa 528 
Asn He Asp He Pro Phe Arg Asp Arg Pro Phe Gly Thr Gly Ser Gin 

165 170 175' 

cag tgc aga gaa act gaa ate caa cga ccc gtt ggt gaa tgc caa agg 576 
Gin Cys Arg Glu Thr Glu He Gin Arg Pro Val Gly Glu Cys Gin Arg 
180 185 190 

ttc gtg gag cag caa atg cag cag tct ccg agg tec act aga cea tac 624 
Phe Val Glu Gin Gin Met Gin Gin Ser Pro Arg Ser Thr Arg Pro Tyr 
195 200 205 

caa cag egg cea gga caa cag cag cag cag cag aga ggg etc caa caa 672 
Gin Gin Arg Pro Gly Gin Gin Gin Gin Gin Gin Arg Gly Leu Gin Gin 
210 215 220 

caa tgc tgc aac gag eta caa aac gtg aag agg gag tgt cat tgc gag 720 

Gin Cys Cys Asn Glu Leu Gin Asn Val Lys Arg Glu Cys His Cys Glu 

225 230 235 240 

gca att caa gaa gtg get agg aga gtg atg agg cag cea cag cag cag 768 

Ala He Gin Glu Val Ala Arg Arg Val Met Arg Gin Pro Gin Gin Gin 

245 250 255 

cag cag caa egt egt. ggg cag ttc ggt ggg cag gag atg gaa acc gcg 816 
Gin Gin Gin Arg Arg Gly Gin Phe Gly Gly Gin Glu Met Glu Thr Ala 

260 265 270 

agg agg gtg att cag aat ctg ccc aac cag tgc gae ttg gaa gtc cag 864 
Arg Arg Val He Gin Asn Leu Pro Asn Gin Cys Asp Leu Glu Val Gin 
275 280 285 

caa tgc aca acc tgt aeg gga tga S88 
Gin Cys Thr Thr Cys Thr Gly 
290 295 

<210> 50 
<211> 295 
<212> PRT 

<213> Helianthus cinnuus 
<400> 50 

Met Ala Lys Gin He Val Leu Ala Leu Ala Phe Ala Ala Leu Val Ala 
15 10 15 

Phe Ala Thr Ala His Thr Thr He He Thr Thr Thr He Glu Asp Glu 
20 25 30 
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Asn Pro lie Ser Gly Gin Arg Gin Val Ser Gin Arg lie Gin Gly Gin 

35 40 45 

Arg Leu Asn Gin Cys Arg Met Phe Leu Gin Gin Gly Gin Asn lie Pro 
50 55 60 

Arg Glu Pile Asp Asn Pro Gin Met Gly Arg Gin Gin Glu Gin Gin Leu 
65 70 75 80 

Gin Gin Cys Cys Gin Glu Leu Gin Asn lie Glu Gly Gin Cys Gin Cys 

85 90 95 

Glu Ala Val Lys Gin Val Phe Arg Glu Ala Gin Gin Gin Val Gin Gin 

100 105 110 

Gin Gin Gly Arg Gin Leu Val Pro Phe Arg Gly Ser Gin Gin Thr Gin 
115 120 125 

Gin Leu Lys Gin Lys Ala Gin lie Leu Pro Asn Val Cys Asn Leu Gin 
130 135 140 

Ser Arg Arg Cys Glu lie Gly Thr He Tlir Th.r Ttir Val Thr Glu Ser 

145 150 155 160 

Asn He Asp He Pro Phe Arg Asp Arg Pro Phe Gly Thr Gly Ser Gin 

165 170 175 

Gin Cys Arg Glu Thr Glu He Gin Arg Pro Val Gly Glu Cys Gin Arg 

180 185 190 

Phe Val Glu Gin Gin Met Gin Gin Ser Pro Arg Ser Thr Arg Pro Tyr 

195 200 205 

Gin Gin Arg Pro Gly Gin Gin Gin Gin Gin Gin Arg Gly Leu Gin Gin 
210 215 220 

Gin Cys Cys Asn Glu Leu Gin Asn Val Lys Arg Glu Cys His Cys Glu 
225 230 235 240 

Ala He Gin Glu Val Ala Arg Arg Val Met Arg Gin Pro Gin Gin Gin 

245 250 255 

Gin Gin Gin Arg Arg Gly Gin Phe Gly Gly Gin Glu Met Glu Thr Ala 

260 265 270 

Arg Arg Val He Gin Asn Leu Pro Asn Gin Cys Asp Leu Glu Val Gin 

275 280 285 

Gin Cys Thr Thr Cys Thr Gly 
290 295 



<210> 51 
<211> 973 
<212> DNA 

<213> Helianthus annuus 

<220> 

<221> CDS 

<222> (2) . . (970) 

<223> coding for partial 2S albvunine 
<400> 51 

g gca aag ata aca ctt etc ttg etc gcc tta get get ctt gta gee ttg 49 
Ala Lys He Thr Leu Leu Leu Leu Ala Leu Ala Ala Leu Val Ala Leu 
I S 10 15 

get aca gee cae aca acc ate ate ace ace acc ate gae gac gag aac 97 
Ala Thr Ala His Thr Thr He He Thr Thr Thr He Asp Asp Glu Asn 
20 25 30 
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ccg ate tec gaa caa agg caa tgt tgg caa cag gta cag gga caa agg 145 
Pro lie Ser Glu Gin Arg Gin Cys Trp Gin Gin Val Gin Gly Gin Arg 
35 40 45 

ttg aac cag tgt cgc atg ttc etc cag caa ggt cag agg ggg cag caa 193 
Leu Asn Gin Cys Arg Met Phe I*eu Gin Gin Gly Gin Arg Gly Gin Gin 
50 55 60 

cac caa cag caa cag cat cag cag cag gag cag cag etc etc eag cag 241 
His Gin Gin Gin Gin His Gin Gin Gin Glu Gin Gin Leu Leu Gin Gin 
65 70 75 80 

tgt tgt caa gag ctt caa aac ate gaa gga cag tge caa tgt gag gcg 2 89 
Cys Cys Gin Glu Leu Gin Asn lie Glu Gly Gin Cys Gin Cys Glu Ala 

85 90 95 • 

gtg aag eag gtg gtc ega gat get cag ega cac gag caa eag ega ccg 337 
Val Lys Gin Val Val Arg Asp Ala Gin Arg His Glu Gin Gin Arg Pro 
100 105 110 

ega gtg ecc ttc cag ggt tct cag eag tct caa eag ttg aag cag agg 3 85 
Arg Val Pro Phe Gin Gly Ser Gin Gin Ser Gin Gin Leu Lys Gin Arg 
115 120 125 

get cag att etc cet aac gta tge aac ctt caa tea aga ega tgc gaa 433 
Ala Gin He Leu Pro Asn Val Cys Asn Leu Gin Ser Arg Arg Cys Glu 
130 135 140 

ate gaa age gtc agg agt gtt get gag age aat ttt gaa ate cea ttt 481 
He Glu Ser Val Arg Ser Val Ala Glu Ser Asn Phe Glu He Pro Plie 
145 150 155 160 

gat atg ccg ttt gat ate cct tgg ece ttt ege eea age tea gag tea 529 
Asp Met Pro Phe Asp He Pro Trp Pro Piie Arg Pro Ser Ser Glu Ser 

165 170 175 

cag caa tgc aga cag agt gaa ate caa agg cct gtg agt cag tgc caa 577 
Gin Gin Cys Arg Gin Ser Glu He Gin Arg Pro Val Ser Gin Cys Gin 

180 185 190 

agg tat gtg gag cag caa att cag tec tec agg cea tae caa eag age 625 
Arg Tyr Val Glu Gin Gin He Gin Ser Ser Arg Pro Tyr Gin Gin Ser 
195 200 205 

eeg tae gae egg agg caa eag age eea tae gae egg agg caa cag age 
Pro Tyr Asp Arg Arg Gin Gin Ser Pro Tyr Asp Arg Arg .Gin Gin Ser 
210 215 220 

cea tat gaa eag agg caa gga cea tae gaa cag agg cea tae gaa cag 
Pro Tyr Glu Gin Arg Gin Gly Pro Tyr Glu Gin Arg Pro Tyr Glu Gin 
225 230 235 240 

agg cea tae caa cag ega gga gga ega cag cag gag eag caa ggg etc 7 69 
Arg Pro Tyr Gin Gin Arg Gly Gly Arg Gin Gin Glu Gin Gin Gly Leu 

245 250 255 

eag caa tge tge aac gag etc caa aac gtg agg agg gag tgt cag tgc 817 
Gin Gin Cys Cys Asn Glu Leu Gin Asn Val Arg Arg Glu Cys Gin Cys 
260 265 270 

gag gcg att aag gaa gtg ggc caa aga atg agg cag eag caa caa caa 865 
Glu Ala He Lys Glu Val Gly Gin Arg Met Arg Gin Gin Gin Gin Gin 
275 280 285 

caa cgt agg cag tat ggt ggg eag eag aea caa act gtg gag aga att 913 
Gin Arg Arg Gin Tyr Gly Gly Gin Gin Thr Gin Thr Val Glu Arg He 
290 295 300 



673 



721 
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ctt gag aat.ctg cct aac caa tgc gac eta gat gtc cag caa tgc aac 961 
Leu Glu Asn Leu Pro Asn Gin Cys Asp Leu Asp Val Gin Gin Cys Asn 
305 310 315 320 

ate ccc tac tga 973 
lie Pro Tyr 

<210> 52 
<211> 323 
<212> PRT 

<213> Helianthus annuus 
<400> 52 

Ala Lys lie Thr Leu Leu Leu Leu Ala Leu Ala Ala Leu Val Ala Leu 
15 10 15 

Ala Thr Ala His Thr Thr lie lie Thr Thr Thr lie Asp Asp Glu Asn 
20 25 30 

Pro lie Ser Glu Gin Arg Gin Cys Trp Gin Gin Val Gin Gly Gin Arg 
35 40 45 

Leu Asn Gin Cys Arg Met Phe Leu Gin Gin Gly Gin Arg Gly Gin Gin 
50 55 60 

His Gin Gin Gin Gin His Gin Gin Gin Glu Gin Gin Leu Leu Gin Gin 
65 70 75 80 

Cys Cys Gin Glu Leu Gin Asn He Glu Gly Gin Cys Gin Cys Glu Ala 

85 90 . 95 

Val Lys Gin Val Val Arg Asp Ala Gin Arg His Glu Gin Gin Arg Pro 
100 105 110 

Arg Val Pro Phe Gin Gly Ser Gin Gin Ser Gin Gin Leu Lys Gin Arg 

115 120 125 

Ala Gin He Leu Pro Asn Val Cys Asn Leu Gin Ser Arg Arg Cys Glu 
130 135 140 

He Glu Ser Val Arg Ser Val Ala Glu Ser Asn Phe Glu He Pro Phe 
145 150 155 160 

Asp Met Pro Phe Asp He Pro Txp Pro Phe Arg Pro Ser Ser Glu Ser 
165 170 175 

Gin Gin Cys Arg Gin Ser Glu He Gin Arg Pro Val Ser Gin Cys Gin 
180 185 190 

Arg Tyr Val Glu Gin Gin He Gin Ser Ser Arg Pro Tyr Gin Gin Ser 
195 200 205 

Pro Tyr Asp Arg Arg Gin Gin Ser Pro Tyr Asp Arg Arg Gin Gin Ser 
210 215 220 

Pro Tyr Glu Gin Arg Gin Gly Pro Tyr Glu Gin Arg Pro Tyr Glu Gin 
225 230 235 240 

Arg Pro Tyr Gin Gin Arg Gly Gly Arg Gin Gin Glu Gin Gin Gly Leu 
245 250 255 

Gin Gin Cys Cys Asn Glu Leu Gin Asn Val Arg Arg Glu Cys Gin Cys 

260 265 270 

Glu Ala He Lys Glu Val Gly Gin Arg Met Arg Gin Gin Gin Gin Gin 
275 280 285 

Gin Arg Arg Gin Tyr Gly Gly Gin Gin Thr Gin Thr Val Glu Arg He 
290 295 300 
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Leu Glu Asn Leu Pro Asn Gin Cys Asp Leu Asp Val Gin Gin Cys Asn 
305 310 315 320 

lie Pro Tyr 



<210> 53 
<211> 1114 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der loinstlichen Sequenz: DNA 
construct coding for dsRNA 

<400> 53 

ggccgcgtgt tccatttggc cggaaacaac cagcagggag gctttggcgg ttcacagcaa 60 
caacaagaac agaaaaactt gtggagcggg ttcgacgcac aggtcatagc tcaagcattg 120 
aaaattgacg ttcagttggc tcagcagctt cagaaccaac aagacagcag aggaaacatc 180 
gttcgtgtta agggaccttt ccaggtcgtg aggccacctc taagacagcc ctacgagagc 240 
gaggagtgga gacacccacg tagccc.acag ggcaacggcc ttgaggagac tatctgcagc 3 00 
atgaggtccc acgagaacat tgacgaccct gctcgtgctg acgtgtacaa gcccagccta 3 60 
ggtcgcgtga ccagcgtcaa cagctatacc ttgcccatct tggagtatgt caggctcagt 420 
gccactcgtg gcgttctcca gggtggatcc ttctgtaaca tttgacaaaa catgtgaaca 480 
cgtcatccgt catatagaac ttccaatttt aatatgtttt gctaaagaaa aaaaaaagga 540 
ataaatatct atcaaattca tttttaaaac atttgtatac gttcttaaat aatttaggat 600 
atgactaatt tttctttttg gtaaaaatgt taatatctat atttaattta ttaagaaaaa 660 
tgtacttaca ccctggagaa cgccacgagt ggcactgagc ctgacatact ccaagatggg 720 
caaggtatag ctgttgacgc tggtcacgcg acctaggctg ggcttgtaca cgtcagcacg 7 80 
agcagggtcg tcaatgttct cgtgggacct catgctgcag atagtctcct caaggccgtt 840 
gccctgtggg ctacgtgggt gtctccactc ctcgctctcg tagggctgtc ttagaggtgg 900 
cctcacgacc tggaaaggtc ccttaacacg aacgatgttt cctctgctgt cttgttggtt 960 
ctgaagctgc tgagccaact gaacgtcaat tttcaatgct tgagctatga cctgtgcgtc 1020 
gaacccgctc cacaagtttt tctgttcttg ttgttgctgt gaaccgccaa agcctccctg 1080 
ctggttgttt ccggccaaat ggaacacgcg gccg 1114 

<210> 54 
<211> 1114 
<212> RNA 

<213> Ktinstliche SBCsaenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: RNA sequence 
for forming dsRNA 

<400> 54 

ggccgcgugu uccauuuggc cggaaacaac cagcagggag gcuuuggcgg uucacagcaa 60 
caacaagaac agaaaaacuu guggagcggg uucgacgcac aggucauagc ucaagcauug 12 0 
aaaauugacg uucaguuggc ucagcagcuu cagaaccaac aagacagcag aggaaacauc 180 
guucguguua agggaccuuu ccaggucgug aggccaccuc uaagacagcc cuacgagagc 240 
gaggagugga gacacccacg uagcccacag ggcaacggcc uugaggagac uaucugcagc 3 00 
augagguccc acgagaacau ugacgacccu gcucgugcug acguguacaa gcccagccua 3 60 
ggucgcguga ccagcgucaa cagcuauacc uugcccaucu uggaguaugu caggcucagu 420 
gccacucgug gcguucucca ggguggaucc uucuguaaca uuugacaaaa caugugaaca 480 
cgucauccgu cauauagaac uuccaauuuu aauauguuuu gcuaaagaaa aaaaaaagga 540 
auaaauaucu aucaaauuca uuuuuaaaac auuuguauac guucuuaaau aauuuaggau 600 
augacuaauu uuucuuuuug guaaaaaugu uaauaucuau auuuaauuua uuaagaaaaa 660 
uguacuuaca cccuggagaa cgccacgagu ggcacugagc cugacauacu ccaagauggg 72 0 
caagguauag cuguugacgc uggucacgcg accuaggcug ggcuuguaca cgucagcacg 780 
agcagggucg ucaauguucu cgugggaccu caugcugcag auagucuccu caaggcccfuu 840 



BNSDOCID: <WO 0307e629A1J_> 



wo 03/078629 



PCT/EP03/02735 



61 

gcccuguggg cuacgugggu gacuccacuc cucgcucucg uagggcuguc uuagaggugg 900 

ccucacgacc uggaaagguc ccuuaacacg aacgauguuu ccucugcugu cuuguugguu 9 60 

crugaagcugc ugagccaacu gaacgucaau uuucaaugcu ugagcuauga ccugugcguc 1020 

gaacccgcuc cacaaguuuu ucucfuucuug uuguugcugu gaaccgccaa agccoicccug 1080 

cugguuguuu ccggccaaau ggaacacgcg gccg 1114 

<210> 55 
<211> 1789 
<212> DNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Besclireibxmg der kUnstlichen Sequenz: DNA 
construct coding for dsRNA 

<400> 55 

gcggccgcgg atcctcaggg tcttttcttg cccactttct tgaacgccgg caaactcacg 60 

tttgttgttc acggaagggg tctaatggga agagttattc cgggatgcgc cgagacgttc 120 

atggagtcac cggtatttgg agaaggtcaa ggtcagggtc agagtcaagg gttccgtgac 180 

atgcaccaga aagtagagca cctacggtgc ggtgacacca ttgcaacacc atctggtgta 240 

gctcaatggt tctacaacaa tggaaatgag cctctcattc ttgttgcagc cgcggatqtc 300 

gccagcaacc agaaccagct tgaccgcaac cttagaccat ttttgatagc cggaaacaac 360 

ccacaagggc aggaatggct acaaggccga aagcaacaga agcaaaacaa catcttcaat 42 0 

ggcttcgcac ctgagatctt ggctcaagcc ttcaagatca atgtcgagac ggctcagcag 480 

ctccagaacc agcaagataa ccgtggcaac atcgtcaagg tcaacggacc tttcggcgtc 540 

attaggccac ccttgagacg cggcgaaggc ggccaacaac cacatgaaat agctaatggt 600 

ttagaggaga ctttgtgcac catgcgatgc actgaaaacc tcgatgaccc gtcggatgct 6 60 

gacgtgtaca agccatcact cggatacatt agcacactta acagctacaa tcttcctatc 720 

ctcagacttc tccgccttag cgctcttcgt ggctccatcc gtaaaactcg aggtaagctc 780 

aacaaatctt tagaaaatta attttatgtg acatatgcaa taatttgatt tggcaagata 840 

aactaataga ttttgcgatt tggagtttta aactctaaat aatctaaatc gttttcaatt 9 00 

ggtttaaata tatatcttgc atttttaatc gtttttaatt aaaaaatata tatatatata 960 

tatatcttgc atttttaatc gttttcaatt taaaaaatat cttgcacgca gaacgctgtc 1020 

gagttttacg gatggagcca cgaagagcgc taaggcggag aagtctgagg ataggaagat 1080 

tgtagctgtt aagtgtgcta atgtatccga gtgatggctt gtacacgtca gcatccgacg 1140 

ggtcatcgag gttttcagtg catcgcatgg tgcacaaagt ctcctctaaa ccattagcta 1200 

tttcatgtgg ttgttggccg ccttcgccgc gtctcaaggg tggcctaatg acgccgaaag 12 60 

gtccgttgac cttgacgatg ttgccacggt tatcttgctg gttctggagc tgctgagccg 1320 

tctcgacatt gatcttgaag gcttgagcca agatctcagg tgcgaagcca ttgaagatgt 13 80 

tgttttgctt ctgttgcttt cggccttgta gccattcctg cccttgtggg ttgtttccgg 1440 

ctatcaaaaa tggtctaagg ttgcggtcaa gctggttctg gttgctggcg agatccgcgg 1500 

ctgcaacaag aatgagaggc tcatttccat tgttgtagaa ccattgagct acaccagatg 1560 

gtgttgcaat ggtgtcaccg caccgtaggt gctctacttt ctggtgcatg tcacggaacc 1620 

cttgactctg accctgacct tgaccttctc caaataccgg tgactccatg aacgtctcgg 1680 

cgcatcccgg aataactctt cccattagac cccttccgtg aacaacaaac -gtgagtttgc 1740 

cggcgttcaa gaaagtgggc aagaaaagac cctgaggatc cgcggccgc 1789 

<210> 56 
<211> 1789 
<212> RNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Beschxeibung der kiinstlictien Sequenz: : RNA 
sequence for forming dsRMA 

<400> 56 

gcggccgcgg auccucaggg ucuuuucuug cccacuuucu ugaacgccgg caaacucacg 60 

uunguuguuc acggaagggg ucuaauggga agaguuauuc cgggaugcgc cgagacguuc 120 

auggagucac cgguauungg agaaggucaa ggucaggguc agagucaagg guuccgugac 180 

augcaccaga aaguagagca ccuacggugc ggugacacca uugcaacacc aucuggugua 240 
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gcucaauggu ucviacaacaa uggaaaugag ccucucauuc uugnugcagc cgcggaucuc 300 
gccagcaacc agaaccagcu ugaccgcaac cuuagaccau uuuugauagc cggaaacaac 3 60 
ccacaagggc aggaauggcu acaaggccga aagcaacaga agcaaaacaa caucuucaau 420 
ggcuucgcac cugagaucuu ggcucaagcc uucaagauca augucgagac ggcucagcag 480 
cuccagaacc agcaagauaa ccguggcaac aucgucaagg ucaacggacc uuucggcguc 540 
auuaggccac ccuugagacg cggcgaaggc ggccaacaac cacaugaaau agcuaauggu ' 600 
uuagaggaga cuuugugcac caiigcg;augc acugaaaacc ucgaugaccc gucggaugcu 660 
gacguguaca agccaucacu cggauacauu agcacacuua acagcuacaa ucuuccuauc 720 
cucagacuuc uccgccuuag cgcucuucgu ggcuccaucc guaaaacucg agguaagcuc 7 80 
aacaaaucuu uagaaaauua auuuuaugug acauaugcaa uaauuugauu uggcaagaua 840 
aacuaauaga uuuugcgauu uggaguuuua aacucuaaau aaucuaaauc guuuucaauu 900 
gguuuaaaua uauaucuugc auuuuuaauc guuuuuaauu aaaaaauaua uauauauaua 960 
uauaucuugc auuuuuaauc guuuucaauu uaaaaaauau cuugcacgca gaacgcuguc 1020 
gaguuuuacg gauggagcca cgaagagcgc uaaggcggag aagucugagg auaggaagau 1080 
uguagcuguu aagugugcua auguauccga gugauggcuu guacacguca gcauccgacg 1140 
ggucaucgag guuuucagug caucgcaugg ugcacaaagu cuccucuaaa ccauuagcua 1200 
uuucaugugg uuguuggccg ccuucgccgc gucucaaggg uggccuaaug acgccgaaag 1260 
guccguugac cuugacgaug uugccacggu uaucuugcug guucuggagc ugcugagccg 1320 
ucucgacauu gaucuugaag gcuugagcca agaucucagg ugcgaagcca uugaagaugu 1380 
uguuuugcuu cuguugcuuu cggccuugua gccauuccug cccuuguggg uuguuuccgg 1440 
cuaucaaaaa uggucuaagg uugcggucaa gcugguucug guugcuggcg agauccgcgg 1500 
cugcaacaag aaugagaggc ucauuuccau uguuguagaa ccauugagcu acaccagaug 1560 
guguugcaau ggugucaccg caccguaggu gcucuacuuu cuggugcaug ucacggaacc 1620 
cuugacucug acccugaccu ugaccuucuc caaauaccgg ugacuccaug aacgucucgg 1680 
cgcaucccgg aauaacucuu cccauuagac cccuuccgug aacaacaaac gugaguuugc 1740 
cggcguucaa gaaagugggc aagaaaagac ccugaggauc cgcggccgc 1789 

<210> 57 
<211> 1273 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz: DNA 
construct coding for dsRNA 

<400> 57 

gcggccgcgg atccatggct aacaagctct tcctcgtctg cgcaactctc gccctctgct 60 
tcctcctcac caacgcttcc atctaccgca ccgttgtcga attcgaagaa gatgacgcca 120 
gcaaccccgt aggtccaaga cagaga'tgcc agaaggagtt tcagcaatca.ca^cacctaa 180 
gagcttgcca gagatggatg agcaagcaaa tgaggcaagg acgtggtggt ggtccttccc 240 
tcgacgatga gttcgatttc gagggccccc agcagggata ccagctactc cagcagtgct 300 
gcaacgagct tcgccaggaa gagccagttt gcgtttgccc caccttgaaa caagctgcca 3 60 
gggcagttag cctccaggga cagcacggac cattccaatc caggaaaatt taccagtcag 420 
ctaagtactt gcctaacatt tgcaagatcc agcaagttgg tgaatgtccc ttccagacca 480 
ccatcccttt cttccctcct tactactagg gtactcgagg taagctcaac aaatctttag 540 
aaaattaatt ttatgtgaca tatgcaataa tttgatttgg caagataaac taatagattt 600 
tgcgatttgg agttttaaac tctaaataat ctaaatcgtt ttcaattggt ttaaatatat 660 
atcttgcatt tttaatcgtt tttaattaaa aaatatatat atatatatat atcttgcatt 720 
tttaatcgtt ttcaatttaa aaaatatctt gcacgcagaa cgctgtcgac taccctagta 780 
gtaaggaggg aagaaaggga tggtggtctg gaagggacat tcaccaactt gctggatctt 840 
gcaaatgtta ggcaagtact tagctgactg gtaaattttc ctggattgga atggtccgtg 900 
ctgtccctgg aggctaactg ccctggcagc ttgtttcaag gtggggcaaa cgcaaactgg 960 
ctcttcctgg cgaagctcgt tgcagcactg ctggagtagc tggtatccct gctgggggcc 1020 
ctcgaaatcg aactcatcgt cgagggaagg accaccacca cgtccttgcc tcatttgctt 1080 
gctcatccat ctctggcaag ctcttaggtg ttgtgattgc tgaaactcct tctggcatct 1140 
ctgtcttgga cctacggggt tgctggcgtc atcttcttcg aattcgacaa cggtgcggta 1200 
gatggaagcg ttggtgagga ggaagcagag ggcgagagtt gcgcagacga ggaagagctt 1260 
gttagccatg gat 1273 
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<210> 58 
<211> 1273 
<212> RNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Beschreibung der kimstlichen Sequenz: : RNA 
sequence for forming dsRNA 

<400> 58 

gcggccgcgg auccauggcu aacaagcucu uccucgucug cgcaacucuc gcccucugcu 60 
uccuccucac caacgcuucc aucuaccgca ccguugucga auucgaagaa gaugacgcca 120 
gcaaccccgu agguccaaga cagagaugcc agaaggaguu ucagcaauca caacaccuaa 180 
gagcuugcca gagauggaug agcaagcaaa ugaggcaagg acgugguggu gguccuuccc 240 
ucgacgauga guucgauuuc gagggccccc agcagggaua ccagcuacuc cagcagugcu 300 
gcaacgagcu ucgccaggaa gagccaguu"u gcguuugccc caccuugaaa caagcugcca 3 60 
gggcaguuag ccuccaggga cagcacggac cauuccaauc caggaaaauu uaccagucag 420 
cuaaguacuu gccuaacaun ugcaagaucc agcaaguugg ugaauguccc uuccagacca 480 
ccaucccuuu cuucccuccu uacuacuagg guacucgagg uaagcucaac aaaucuuuag 540 
aaaauuaauu uuaugugaca uaugcaauaa uuugauuugg caagauaaac uaauagauuu 600 
ugcgauuugg aguiiuuaaac ucuaaauaau cuaaaucguu uucaauuggu uuaaauauau 660 
aucuugcauu uuuaaucguu uuuaauuaaa aaauauauau auauauauau aucuugcauu 720 
uuuaaucguu uucaauuuaa aaaauaucuu gcacgcagaa cgcugucgac uacccuagua 780 
guaaggaggg aagaaaggga ugguggucug gaagggacau ucaccaacuu gcuggaucuu 840 
gcaaauguua ggcaaguacu uagcugacug guaaauuuuc cuggauugga augguccgug 900 
cugucccugg aggcuaacug cccuggcagc uuguuucaag guggggcaaa cgcaaacugg 960 
cucuuccugg cgaagcucgu ugcagcacug cuggaguagc ugguaucccu gcugggggcc 1020 
cucgaaaucg aacucaucgu cgagggaagg accaccacca cguccuugcc ucauuugcuu 1080 
gcucauccau cucuggcaag cucuuaggug uugugauugc ugaaacuccu ucuggcaucu 1140 
cugucuugga ccuacggggu ugcuggcguc aucuucuucg aauucgacaa cggugcggua 1200 
gauggaagcg uuggugagga ggaagcagag ggcgagaguu gcgcagacga ggaagagcuu 1260 
guuagccaug gau 1273 

<210> 59 

<211> 1575 

<212> DNA 

<213> Arabidopsis tlialiana 

<220> 

<221> CDS 

<222> (1) . . (1572) 

<223> 12S cruciferin. 

<400> 59 

atg gtt aag etc age aat etc etc gtt gca acc ttc ggg gtt etc etc 48 

Met Val Jjys Leu Ser Asn Leu Leu Val Ala Thr Phe Gly Val Leu Leu 

15 10 15 

gtc ett aac gge tge ctt gcg agg eag tea ctt ggg gtt cot cct cag 96 
Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 
20 25 30 

eta eag aac gag tgt aac etc gac aac eta gat gtt etc caa gee acc 144 
Leu Gin Asn Glu Cys Asn Leu Asp Asn Leu Asp Val Leu Gin Ala Thr 
35 40 45 

gaa act ate aag agt gaa gee ggt eag ate gag tac tgg gac cae aac 192 
Glu Tiir lie Lys Ser Glu Ala Gly Gin lie Gin Tyr Tip Asp His Asn 
50 55 60 

cae cct eag etc ega tgt gtt ggt gtt tec gtt get cgt tat gta att 240 
His Pro Gin Leu Arg Cys Val Gly Val Ser Val Ala Arg Tyr Val lie 
65 70 75 80 
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gaa caa ggc ggt ctt tac ttg ccc acc ttc ttc act tec oca aaa att 288 

Glu Gin Gly Gly Leu Tyr Leu Pro Tlir Plie Ph.e Thr Ser Pro Lys He 

85 .90 95 

tec tac gtc gtt caa gga acg ggt ate age gga aga gtg gtc cct gga 33 6 
Ser Tyr Val Val Gin Gly Thr Gly He Ser Gly Arg Val Val Pro Gly 
100 105 110 

tgt gcc gag acc ttc atg gac teg cag ccg atg caa gga caa caa caa 384 
Cys Ala Glu Thr Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 

115 120 125 

ggc caa eca tgg caa gga cga cag gga caa caa ggc caa cea tgg gaa 432 
Gly Gin Pro Trp Gin Gly Arg Gin Gly Gin Gin Gly Gin Pro Trp Glu 
130 .135 140 

gga cag gga caa cag gga caa caa gga aga caa ggc caa cea tgg gaa 480 
Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg Gin Gly Gin Pro Trp Glu 
. 145 150 155 160 

gga cag gga caa cag gga caa caa gga cga cag gga caa caa ggc caa 528 ■ 
Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg' Gin Gly Gin Gin Gly Gin 
165 170 175 

eca tgg gaa gga cag gga cag cag gga caa caa ggg ttc cgt gac atg 576 
Pro Trp Glu Gly Gin Gly Gin Gin Gly Gin Gin Gly Phe Arg Asp Met 
180 185 190 

cac cag aag gtg gaa cat gtg aga cgc gga gac gtc ttt gcc aac act 624 
His Gin Lys Val Glu His Val Arg Arg Gly Asp Val Phe Ala Asn Thr 
195 200 205 

cea ggc tct gcc cac tgg ate tac aac tea gga gaa cag cea ctt gtc 672 
Pro Gly Ser Ala His Trp He Tyr Asn Ser Gly Glu Gin Pro Leu Val 
210 215 220 

ate ate get ctt etc gac ate gcc aac tac caa aac caa etc gac cgc 720 
He He Ala Leu Leu Asp He Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
225 230 235 240 

aac cct aga gtg ttc cat ttg gcc gga aac aac cag cag gga ggc ttt 768 
Asn Pro Arg Val Phe His Leu Ala Gly, Asn Asn Gin Gin Gly Gly Phe 

245 250 255 

ggc ggt tea cag caa caa caa gaa cag aaa aac ttg tgg age ggg ttc 816 
Gly Gly Ser Gin Gin Gin Gin Glu Gin Lys Asn Leu Trp Ser Gly Phe 
260 265 270 

gac gea cag gtc ata get caa gca ttg aaa att gac gtt cag ttg get 864 
Asp Ala Gin Val He Ala Gin Ala Leu Lys He Asp Val Gin Leu Ala 
275 280 285 

cag cag ctt cag aac caa caa gac age aga gga aac ate gtt cgt gtt 912 
Gin Gin Leu Gin Asn Gin Gin Asp Ser Arg Gly Asn He Val Arg Val 
290 295 300 

aag gga cct ttc cag gtc gtg agg cea cct eta aga cag ccc tac gag 9 60 
Lys Gly Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu 
305 310 315 320 

age gag gag tgg aga cac cea cgt age eca cag ggc aac ggc ctt gag 1008 
Ser Glu Glu Trp Arg His Pro Arg Ser Pro Gin Gly Asn Gly Leu Glu 

325 330 335 

gag act ate tgc age atg agg tec cac gag aac att gac gac cct get 1056 
Glu Thr He Cys Ser Met Arg Ser His Glu Asn He Asp Asp Pro Ala 
340 345 350 
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cgt get gac gtg tac aag ccc age eta ggt cgc gtg ace age gtc aac 1104 
Arg Ala Asp Val Tyr Lys Pro Ser Leu Gly Arg Val Thr Ser Val Asn 
355 360 365 

age tat ace ttg cec ate ttg gag tat gtc agg etc agt gee act cgt 1152 
Ser Tyr Thr Leu Pro He Leu Glu Tyr Val Arg Leu Ser Ala Tlxr Arg 
370 375 380 

ggc gtt etc eag ggt aat geg atg gtg ctt cct aaa tac aac atg aac 1200 
Gly Val Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn Met Asn 
385 390 395 400 

get aac gag ate ttg tac tge act gga gga caa gga agg ate caa gtg 1248 
Ala Asn Glu He Leu Tyr Cys Thr Gly Gly Gin Gly Arg He Gin Val 

405 410 415 

gtc aac .gac aac gga cag aac gtg ttg gac caa eag gtg eag aag gga 1296 
Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin Lys Gly 
420 425 .430 

eag etc gtg gtc . ate eca caa ggg ttc gea tac gtt gtc cag tec cac 1344 
Gin Leu Val Val He Pro Gin Gly Phe Ala Tyr Val Val Gin Ser His 
435 440 445 

gga aac aag ttc gag tgg ate tct ttc aaa act aat gaa aac gea atg 1392 
Gly Asn Lys Phe Glu Trp He Ser Phe Lys Thr Asn Glu Asn Ala Met 
450 455 460 

• ate age act ttg geg ggt aga ace teg etc ttg agg gea ttg eca ttg 1440 
He Ser Thr Leu Ala Gly Arg Thr Ser Leu Leu Arg Ala Leu Pro Leu 
465 470 475 480 

gag gtc ata tea aat ggt ttc cag ate tct cec gag gaa get agg aag 1488 
Glu Val He Ser Asn Gly Phe Gin He Ser Pro Glu Glu Ala Arg Lys 
485 490 495 

ate aag ttc aac aca ctt gag ace act ttg ace cgc get gee ggt agg 153 6 
He Lys Phe Asn Tlir Leu Glu Thr Thr Leu Thr Arg Ala Ala Gly Arg 
500 505 510 

caa caa caa eag ttg ate gag gag att gtc gag get taa 1575 
Gin Gin Gin Gin Leu He Glu Glu He Val Glu Ala 
515 520 

<210> 60 
<211> 524 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 60 

Met Val Lys Leu Ser Asn Leu Leu Val Ala Thr Phe Gly Val Leu Leu 
15 10 15 

Val Leu Asn Gly Cys Leu Ala Arg Gin Ser Leu Gly Val Pro Pro Gin 

20 25 30 

Leu Gin Asn Glu Cys Asn Leu Asp Asn Leu Asp Val Leu Gin Ala Thr 
35 40 45 

Glu Thr He Lys Ser Glu Ala Gly Gin He Glu Tyr Trp Asp His Asn 
50 55 60 

His Pro Gin Leu Arg Cys Val Gly Val Ser Val Ala Arg Tyr Val He 
65 70 75 80 

Glu Gin Gly Gly Leu Tyr Leu Pro Thr Phe Phe Thr Ser Pro Lys He 

85 90 95 
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Ser Tyr Val Val Gin Gly Thr Gly He Ser Gly Arg Val Val Pro Gly 

100 105 110 

Cys Ala Glu Tlir Phe Met Asp Ser Gin Pro Met Gin Gly Gin Gin Gin 
115 120 125 

Gly Gin Pro Trp Gin Gly Arg Gin Gly Gin Gin Gly Gin Pro Trp Glu 
130 135 140 

Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg Gin Gly Gin Pro Trp Glu 
145 150 155 160 

Gly Gin Gly Gin Gin Gly Gin Gin Gly Arg Gin Gly Gin Gin Gly Gin 
165 170 175 

Pro Trp Glu Gly Gin Gly Gin Gin Gly Gin Gin Gly Phe Arg Asp Met 
180 185 190 

His Gin Lys Val Glu His Val Arg Arg Gly Asp Val Phe Ala Asn Thr 
195 200 205 

Pro Gly Ser Ala His Trp He Tyr Asn Ser Gly Glu Gin Pro Leu Val 
210 • 215 220 

He He Ala Leu Leu Asp He Ala Asn Tyr Gin Asn Gin Leu Asp Arg 
225 230 235 240 

Asn Pro Arg Val Phe His Leu Ala Gly Asn Asn Gin Gin Gly Gly Phe 

245 250 255 

Gly Gly Ser Gin Gin Gin Gin Glu Gin Lys Asn Leu Trp Ser Gly Phe 
260 265 270 

Asp Ala Gin Val He Ala Gin Ala Leu Lys He Asp Val Gin Leu Ala 
275 280 285 

Gin Gin Leu Gin Asn Gin Gin Asp Ser Arg Gly Asn He Val Arg Val 
290 295 300 

Lys Gly Pro Phe Gin Val Val Arg Pro Pro Leu Arg Gin Pro Tyr Glu 
305 310 315 320 

Ser Glu Glu Trp Arg His Pro Arg Ser Pro Gin Gly Asn Gly Leu Glu 
325 330 335 

Glu Thr He Cys Ser Met Arg Ser His Glu Asn He Asp Asp Pro Ala 

340 345 350 

Arg Ala T^p Val Tyr Lys Pro Ser Leu Gly Arg Val Thr Ser Val Asn 
355 360 365 

Ser Tyr Thr Leu Pro He Leu Glu Tyr Val Arg Leu Ser Ala Thr Arg 
370 375 380 

Gly Val Leu Gin Gly Asn Ala Met Val Leu Pro Lys Tyr Asn Met Asn 
385 390 395 400 

Ala Asn Glu He Leu Tyr Cys Thr Gly Gly Gin Gly Arg He Gin Val 
405 410 415 

Val Asn Asp Asn Gly Gin Asn Val Leu Asp Gin Gin Val Gin Lys Gly 
420 425 430 

Gin Leu Val Val He Pro Gin Gly Phe Ala Tyr Val Val Gin Ser His 
435 440 445 

Gly Asn Lys Phe Glu Trp He Ser Phe Lys Thr Asn Glu Asn Ala Met 
450 455 460 

He Ser Thr Leu Ala Gly Arg Thr Ser Leu Leu Arg Ala Leu Pro Leu 
465 470 475 480 
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Glu Val lie Ser Asn Gly Phe Gin lie 
485 

lie Lys Phe Asn Thr Leu Glu Thr Thx 

500 505 

Gin Gin Gin Gin Leu lie Glu Glu lie 
515 520 
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Ser Pro Glu Glu Ala Arg Lys 
490 495 

Leu Thx Arg Ala Ala Gly Arg 
510 

Val Glu Ala 



<210> 61 
<211> 1419 
<212> mA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1416) 

<223> 12 S Cral storage protein 

<400> 61 

atg get cga gtc tct tct ctt ctt tct ttc tgc tta aca ctt ttg ate 48 

Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu lie 
1-5 10 15 

ctt ttc cat ggc tac gcg get caa eag ggt cag cag ggt cag cag ttt 96 
Leu Phe His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin PKe 
20 25 30 

ccg aac gag tgc cag etc gae eag etc aat gcg etc gag ccg tea cac 144 
Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 
35 40 45 

gta ctg aag age gag get ggt cge ate gag gtg tgg gae cac cac get 192 
Val Leu Lys Ser Glu Ala Gly Arg He Glu Val Trp Asp His His Ala 
50 55 60 

cet cag etc cgt tgc tea ggt gtc tec ttt gea egt tac ate ate gag 240 
Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr He He Glu 
65 70 75 80 

tct aag ggt etc tac ttg ccc tct ttc ttt aac ace gcg aag etc tct 288 
Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 

85 90 95 

ttc gtg get aag gga ega ggt ctt atg gga aaa gtg ate cet gga tgc 336 
Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val lie Pro Gly Cys 
100 105 110 

gee gaa aca ttc caa gae tea tea gag ttc caa cea cge ttc gaa ggt 384 

Ala Glu Thr Phe Gin Asp Ser Ser Glu Phe Gin Pro Arg Phe Glu Gly 

115 120 125 

caa ggt caa age cag agg ttc cgt gae atg cac cag aaa gtg gag cac 432 

Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 

130 135 140 

att agg age ggt gat ace att gee aca aca ccc ggt gta gea cag tgg 480 
He Arg Ser Gly Asp Thr He Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

ttc tac aac gae gga cag eag cea ctt gtc ate gtc age gtc ttc gat 528 
Phe Tyr Asn Asp Gly Gin Gin Pro Leu Val He Val Ser Val Ph.e Asp 
165 170 175 

eta gee agt cac cag aac eag ctt gae cge aac cea agg cea ttt tac 576 
Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 
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tta gcc gga aac aac cca caa ggt caa gta tgg eta caa gga cga gag 624 
Leu Ala Gly Asn Asn Pro Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
195 200 205 

caa cag cca cag aag aac att ttc aat gga ttt gga ccc gag gtt att: 672 
Gin Gin Pro Gin Lys Asn lie Plie Asn Gly Plie Gly Pro Glu Val lie 
210 215 220 

get caa get ttg aag ate gat ctt cag aca gea cag caa ctt cag aac 720 
Ala Gin Ala Leu Lys lie Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 

225 230 235 240 

caa gat gac aac cgt gga aac att gtc cga gtc caa gga ccg ttc ggt 7 68 
Gin Asp Asp Asn Arg Gly Asn lie Val Arg Val Gin Gly Pro Phe Gly 
245 250 255 

gtc att agg ccg ect ttg agg ggc cag aga cct cag gag gag gaa gaa 816 
Val lie Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 
260 265 270 

gaa gaa gga cga cat gga cga cac ggt aat ggc tta gag gag acc ate 864 
Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr lie 
275 280 285 

tgc age gcc agg tgc acc gat aac etc gat gac ccg tct cgt get gac' 912 
Cys Ser Ala Arg Cys Tlir Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

gtg tac aag cca cag etc ggt tac ate age act etc aac agt tac gat 960 
Val Tyr Lys Pro Gin Leu Gly Tyr lie Ser Thr Leu Asn Ser Tyr Asp 
305 310 315 320 

etc ccc att ctt cgc ttc ate cgt etc tea gee etc cgt gga tct ate 1008 
Leu Pro He Leu Arg Phe He Arg Leu Ser Ala Leu Arg Gly Ser He 
325 330 335 

cgt caa aac gca atg gtg ctt cca cag tgg aac gea aac geg aac get 1056 
Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
340 345 350 

att ctt tac gag aca gac ggg gaa gee caa ate cag ate gta aac gac 1104 
He Leu Tyr .Glu Thr Asp Gly Glu Ala Gin He Gin He Val Asn Asp 
355 360 365 

aat ggt aac aga gtg ttt gac gga caa gtc tct caa gga cag etc ata 1152 
Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu He 
370 375 380 

gee gta cca caa ggt ttc teg gtg gtg aaa cgc gca aca age aac cga 1200 
Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Asn Arg 
385 390 395 400 

ttc cag tgg gtt gag ttc aaa aca aac get aac geg caa ate aac act 1248 
Phe Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala Gin He Asn Thr 
405 410 415 

etg geg gga cga acc tea gtc ttg aga ggt tta cca ctt gaa gtc ata 1296 
Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 

420 425 430 

ace aat ggg ttc caa ate tea ccc gaa gaa gca agg agg gtc aag ttc 1344 
Thr Asn Gly Phe Gin He Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 
435 440 445 

aac acg etc gag acc act ttg act cac age agt ggc cca get age tac 1392 
Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
450 455 460 
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gga agg cca aga gtg get gca get taa 1419 
Gly Arg Pro Arg Val Ala Ala Ala 
465 470 

<210> 62 
<211> 472 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 62 

Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu He 
15 10 15 

Leu Phe .His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin Phe 
20 25 30 

Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 
35 40 45 

Val Leu Lys Ser Glu Ala Gly Arg lie Glu Val Trp Asp His His Ala 
50 55 60 

Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr lie He Glu 
65 70 75 80 

Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 

85 90 95 

Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val He Pro Gly Cys 

100 105 110 

Ala Glu Thr Phe Gin Asp Ser Ser Glu. Phe Gin Pro Arg Phe Glu Gly 
115 120 125 

Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 

130 135 140 

He Arg Ser Gly Asp Thr He Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

Phe Tyr Asn Asp Gly Gin Gin Pro Leu Val He Val Ser Val Phe Asp 
165 170 175 

Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 

Leu Ala Gly Asn Asn Pro Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
195 200 205 

Gin Gin Pro Gin Lys Asn He Phe Asn Gly Phe Gly Pro Glu Val He 

210 215 220 

Ala Gin Ala Leu Lys He Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 
225 230 235 240 

Gin Asp Asp Asn Arg Gly Asn He Val Arg Val Gin Gly Pro Phe Gly 

245 250 255 

Val He Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 
260 265 270 

Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr He 
275 280 285 

Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 
305 310 315 320 
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Leu Pro He Leu Arg Phe He Arg Leu Ser Ala Leu Arg Gly Ser He 

325 330 335 

Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 
340 345 350 

He Leu Tyr Glu Tlir Asp Gly Glu Ala Gin He Gin He Val Asn Asp 

355 360 365 

Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu He 
370 375 380 

Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Asn Arg 
385 390 395 400 

Phe Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala Gin He Asn Thr 
405 410 415 

Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 

420 425 430 

Thr Asn Gly Phe Gin He Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 

435 440 445 

Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
450 455 460 

Gly Arg Pro Arg Val Ala Ala Ala 
465 470 



<210> 63 
<211> 1419 
.<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1416) 

<223> At5g442120/MLN1_4 storage protein 
<400> 63 

atg get cga gtc tct tct ctt ctt tct ttc tgc tta aca ctt ttg ate 48 
Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu He 
1 5 10 15 

ctt ttc cat ggc tac gcg get caa eag ggt cag cag ggt cag eag ttt 96 
Leu Phe His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin Phe 
20 25 30 

ceg aac gag tgc cag etc gac eag etc aat gcg etc gag ccg tea cac 144 
Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 
35 40 45 

gta etg aag age gag get ggt egc ate gag gtg tgg gac cac cac get 192 
Val Leu Lys Ser Glu Ala Gly Arg He Glu Val Trp Asp His His Ala 

50' 55 60 

ect cag etc cgt tgc tea ggt gtc tec ttt gea cgt tac ate ate gag 240 
Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr He He Glu 
65 70 75 80 

tct aag ggt etc tac ttg ccc tct ttc ttt aac ace gcg aag etc tct 288 
Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 

85 90 95 

ttc gtg get aag gga cga ggt ctt atg gga aaa gtg ate cct gga tgc 336 
Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val He Pro Gly Cys 
100 105 110 
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gcc gaa aca ttc caa gac tea tea gag ttc caa cca cgc ttc gaa ggt 384 
Ala Glu Thr Phe Gin Asp Ser Ser Glu Phe Glri Pro Arg Phe Glu Gly 
115 120 125 

caa ggt caa age cag agg ttc cgt gac atg cac cag aaa gtg gag cac 432 
Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 
130 135 140 

att agg age ggt gat ace att gcc aca aca cec ggt gta gca cag tgg 480 
lie Arg Ser Gly Asp Tiir He Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

ttc tac aac gac gga cag gaa cca ctt gtc ate gtc age gtc ttc gat 528 
Phe Tyr Asn Asp Gly Gin Glu Pro Leu Val He Val Ser Val Phe Asp 

165 170 175 

eta gcc agt cac cag aac cag ctt gac cgc aac cca agg cca ttt tac 576 
Deu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 

tta gcc gga aac aac cca caa ggt caa gta tgg eta caa gga cga gag 624 
Leu Ala Gly Asn Asn Pro Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
195 200 205 

caa cag cca cag aag aac att ttc aat gga ttt gga ecc gag gtt att 672 
Gin Gin Pro Gin Lys Asn He Phe Asn Gly Phe .Gly Pro Glu Val He 
210 215 220 

get caa get ttg aag ate gat ctt cag aca gca cag caa ctt cag aac 720 
Ala Gin Ala Leu Lys He Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 
225 230 235 240 

caa gat gac aac cgt gga aac att gtc cga gtc caa gga ccg ttc ggt 768 
Gin Asp Asp Asn Arg Gly Asn He Val Arg Val Gin Gly Pro Phe Gly 
245 250 255 

-gtc att agg ccg cct ttg agg ggc cag aga cct cag gag gag gaa gaa 816 
Val He Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 
260 265 270 

gaa gaa gga cga eat gga cga cac ggt aat ggc tta gag gag ace ate 864 
Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr He 
275 280 285 

tgc age gcc agg tgc acc gat aac etc gat gac ccg tct- cgt. get gac 912 
Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

gtg tac aag cca cag etc ggt tac ate age act etc aac agt tac gat 960 
Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 
305 310 315 320 

etc ecc ate ctt cgc ttc ate cgt etc tea gcc etc cgt gga tct ate 1008 
Leu Pro He Leu Arg Phe He Arg Leu Ser Ala Leu Arg Gly Ser He 

325 330 335 

cgt caa aac gca atg gtg ctt cca cag tgg aac gca aac gcg aac get 1056 
Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 

340 345 350 

att ctt tac gtg aca gac ggg gaa gcc caa ate cag ate gta aac gac 1104 
He Leu Tyr Val Thr Asp Gly Glu Ala Gin He Gin He Val Asn Asp 

355 360 365 ' 

aat ggt aac aga gtg ttt gac gga caa gtc tct caa gga cag etc ata 1152 
Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu He 
370 375 380 
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gcc gta cca caa ggt ttc teg gtg gtg aaa cgc gca aca age aac cga 1200 

Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Tlir Ser Asn Arg 
385 390 395 400 

ttc cag tgg gtt gag ttc aaa aca aac get aac gcg caa ate aac act 1248 
Pile Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala Gin lie Asn Tlir 
405 410 415 

ctg gcg gga cga acc tea gtc ttg aga ggt tta cca ctt gaa gtc ata 1296 
Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val lie 
420 425 430 

ace aat ggg ttc caa ate tea cec gaa gaa gca agg agg gtc aag ttc- 1344 
Thr Asn Gly Phe Gin lie Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 
435 440 445 

aac acg etc gag acc act ttg act cac age agt ggc cca get age tae 1392 
Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 
450 455 460 

gga agg cca agg gtg get gca get taa 1419 
Gly Arg Pro Arg Val Ala Ala Ala 
465 470 

<210> 64 
<211> 472 
<212> PRT 

<213> Arabidopsis thaliana 

<400> 64 

Met Ala Arg Val Ser Ser Leu Leu Ser Phe Cys Leu Thr Leu Leu lie 
1 5 10 15 

Leu Phe His Gly Tyr Ala Ala Gin Gin Gly Gin Gin Gly Gin Gin Phe 
20 25 30 

Pro Asn Glu Cys Gin Leu Asp Gin Leu Asn Ala Leu Glu Pro Ser His 
35 40 45 

Val Leu Lys Ser Glu Ala Gly Arg lie Glu Val Trp Asp His His Ala 
50 . 55 60 

Pro Gin Leu Arg Cys Ser Gly Val Ser Phe Ala Arg Tyr lie He Glu 
65 70 75 80 

Ser Lys Gly Leu Tyr Leu Pro Ser Phe Phe Asn Thr Ala Lys Leu Ser 

85 90 95 

Phe Val Ala Lys Gly Arg Gly Leu Met Gly Lys Val He Pro Gly Cys 
100 105 110 

Ala Glu Thr Phe Gin Asp Ser Ser Glu Phe Gin Pro Arg Phe Glu Gly 
115 120 125 

Gin Gly Gin Ser Gin Arg Phe Arg Asp Met His Gin Lys Val Glu His 
130 135 140 

He Arg Ser Gly Asp Thr He Ala Thr Thr Pro Gly Val Ala Gin Trp 
145 150 155 160 

Phe Tyr Asn Asp Gly Gin Glu Pro Leu Val He Val Ser Val Phe Asp 
165 170 175 

Leu Ala Ser His Gin Asn Gin Leu Asp Arg Asn Pro Arg Pro Phe Tyr 
180 185 190 

Leu Ala Gly Asn Asn Pro Gin Gly Gin Val Trp Leu Gin Gly Arg Glu 
195 200 205 
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Gin Gin Pro Gin Lys Asn lie Phe Asn Gly Phe Gly Pro Glu Val lie 

210 215 220 

Ala Gin Ala Leu Lys He Asp Leu Gin Thr Ala Gin Gin Leu Gin Asn 
225 230 235 240 

Gin Asp Asp Asn Arg Gly Asn He Val Arg Val Gin Gly Pro Phe Gly 

245 250 255 

Val lie Arg Pro Pro Leu Arg Gly Gin Arg Pro Gin Glu Glu Glu Glu 

260 265 270 

Glu Glu Gly Arg His Gly Arg His Gly Asn Gly Leu Glu Glu Thr He 
275 280 285 

Cys Ser Ala Arg Cys Thr Asp Asn Leu Asp Asp Pro Ser Arg Ala Asp 
290 295 300 

Val Tyr Lys Pro Gin Leu Gly Tyr He Ser Thr Leu Asn Ser Tyr Asp 
305 310 315 320 

Leu Pro He Leu Arg Phe He Arg Leu Ser Ala Leu Arg Gly Ser He 

325 330 335 

Arg Gin Asn Ala Met Val Leu Pro Gin Trp Asn Ala Asn Ala Asn Ala 

340 345 350 

He Leu Tyr Val Thr Asp Gly Glu Ala Gin He Gin He Val Asn Asp 

355 360 365 

Asn Gly Asn Arg Val Phe Asp Gly Gin Val Ser Gin Gly Gin Leu He 
370 375 380 

Ala Val Pro Gin Gly Phe Ser Val Val Lys Arg Ala Thr Ser Asn Arg 
385 390 395 400 

Phe Gin Trp Val Glu Phe Lys Thr Asn Ala Asn Ala Gin He Asn Thr 
405 410 415 

Leu Ala Gly Arg Thr Ser Val Leu Arg Gly Leu Pro Leu Glu Val He 

420 425 430 

Thr Asn Gly Phe Gin He Ser Pro Glu Glu Ala Arg Arg Val Lys Phe 
435 440 445 

Asn Thr Leu Glu Thr Thr Leu Thr His Ser Ser Gly Pro Ala Ser Tyr 

450 455 460 

Gly Arg Pro Arg Val Ala Ala Ala 
465 470 



<210> 65 

<211> 1368 

<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1365) 

<223> 12S Crb storage protein 

<400> 65 

atg ggt cga gtc tea tct att ate 
Met Gly Arg Val Ser Ser He He 
1 5 

etc ttc aat ggc tac act gcc caa 
Leu Phe Asn Gly Tyr Thr Ala Gin 
20 



tet ttc tct ttg aca etc ttg ate 48 
Ser Phe Ser Leu Thr Leu Leu He 
10 15 

cag tgg ccc aac gag tgc cag etc 96 
Gin Trp Pro Asn Glu Cys Gin Leu 
25 30 
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gat caa etc 
Asp Gin Leu 
35 

ggt cgc ate 
Gly Arg He 

50 

ggc ttt gcc 
Gly Pbe Ala 
65 

ccc act ttc 
Pro Thr Plie 

ggt eta atg 
Gly Leu Met 

tea eeg gta 
Ser Pro Val 
115 

cgt gac atg 
Arg Asp Met 
130 

gea aea cea 
Ala Thr Pro 
145 

cct etc att 
Pro Leu He 

ctt gac cgc 
Leu Asp Arg 

ggg eag gaa 
Gly Gin Glu 
195 

ttc aat ggc 
Ptie Asn Gly 
210 

gtc gag aeg 
Val Glu Thr 
225 

ate gte aag 
He Val Lys 



cgc ggc gaa 
Arg Gly Glu 

gag act ttg 
Glu Thr Leu 
275 

gat get gae 
Asp Ala Asp 
290 



aat gcg etc gaa 
Asn Ala Leu Glu 

gag gtc tgg gac 
Glu Val Trp Asp 

55 

ttt gag cgt ttc 
Phe Glu Arg Phe 
70 

ttg aac gcc ggc 
Leu Asn Ala Gly 
85 

gga aga gtt att 
Gly Arg Val He 
100 

ttt gga gaa ggt 
Phe Gly Glu Gly 

cac cag aaa gta 
His Gin Lys Val 

135 

tct ggt gta get 
Ser Gly Val Ala 
150 

ctt gtt gea gcc 
Leu Val Ala Ala 
165 

aac ctt aga cea 
Asn Leu Arg Pro 
180 

tgg eta caa ggc 
Trp Leu Gin Gly 

ttc gea cct gag 
Phe Ala Pro Glu 
215 

get cag cag etc 
Ala Gin Gin Leu 
230 

gtc aac gga cct 
Val Asn Gly Pro 
245 

ggc ggc caa caa 
Gly Gly Gin Gin 
260 

tge acc atg cga 
Cys Thr Met Arg 

gtg tac aag cea 
Val Tyr Lys Pro 
295 



74 

cea tec caa ate 
Pro Ser Gin He 
40 

cac cat gea ccc 
His His Ala Pro 

gtc att gag cct 
Val He Glu Pro 
75 

aaa etc aeg ttt 
Lys Leu Thr Phe 
90 

eeg gga tge gee 
Pro Gly Cys Ala 
105 

caa ggt cag ggt 
Gin Gly Gin Gly 
120 

gag cac eta egg 
Glu His Leu Arg 

caa tgg ttc tac 
Gin Trp Phe Tyr 

155 

gcg gat etc gee 
Ala Asp Leu Ala 
170 

ttt ttg ata gee 
Phe Leu He Ala 
185 

ega aag caa cag 
Arg Lys Gin Gin 
200 

ate ttg get caa 
He Leu Ala Gin 

cag aac cag caa 
Gin Asn Gin Gin 
235 

ttc ggc gtc att 
Phe Gly Val He 
250 

cea cat gaa ata 
Pro His Glu He 
265 

tge act gaa aac 
Cys Thr Glu Asn 
280 

tea etc gga tac 
Ser Leu Gly Tyr 



ate aag age 
He Lys Ser 
45 

eag etc cgt 
Gin Leu Arg 
60 

cag ggt ctt 
Gin Gly Leu 

gtt gtt cac 
Val Val His 



gag aeg ttc 
Glu Thr Phe 
110 

cag agt caa 
Gin Ser Gin 
125 

tge ggt gac 
Cys Gly Asp 
140 

aac aat gga 
Asn Asn Gly 

age aac eag 
Ser Asn Gin 



gga aac aac 
Gly Asn Asn 
190 

aag caa aac 
Lys Gin Asn 
205 

gee ttc aag 
Ala Phe Lys. 
220 

gat aac cgt 
Asp Asn Arg 

agg oca ccc 
Arg Pro Pro 

get aat ggt 
Ala Asn Gly 
270 

etc gat gac 
Leu Asp Asp 
285 

att age aca 
He Ser Thr 
300 



gag ggt 144 
Glu Gly 

tge tec 192 
Cys Ser 

ttc ttg 240 
Phe Leu 
80 

gga agg 288 
Gly Arg 
95 

atg gag 336 
Met Glu 

ggg ttc 384 
Gly Phe 

acc att 432 
Thr He 

aat gag 480 
Asn Glu 
160 

aac eag 528 

Asn Gin 

175 

cea caa 576 
Pro Gin 

aac ate 624 
Asn He 

ate aat 672 
He Asn 

ggc aac 720 
Gly Asn 
240 

ttg aga 768 
Leu Arg 

255 

tta gag 816 
Leu Glu 

eeg teg 864 
Pro Ser 

ctt aac . 912 
Leu Asn 
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age tac aat ctt cct ate etc 
Ser Tyr Asn Leu Pro lie Leu 
305 310 

ggc tec ate cgt aaa aac get 
Gly Ser He Arg Lys Asn Ala 
325 

gca aac gcg gca etc tac gtg 
Ala Asn Ala Ala Leu Tyr Val 
340 

gtg aac gac aac gga gaa aga 
Val Asn Asp Asn Gly Glu Arg 
355 

cag tta eta gtc gtg eca caa 
Gin Leu Leu Val Val Pro Gin 

370 375 

ggc gaa cag ttc gag tgg ate 
Gly Glu Gin Phe Glu Trp He 
385 390 

gtc aac aca etc gcg ggc cgt 
Val Asn Thr Leu Ala Gly Arg 
405 

gag gtt ata ace aat ggg tac 
Glu Val He Tlir Asn Gly Tyr 
420 

gta aag ttt age aeg att gag 
Val Lys Phe Ser Thr He Glu 
435 

age tac gga agg cct agg get 
Ser Tyr Gly Arg Pro Arg Ala 
450 455 

<210> 66 
<211> 455 
<212> PRT 

<213> Arabidopsis thaliana 

<400> 66 

Met Gly Arg Val Ser Ser He 
1 5 

Leu Phe Asn Gly Tyr Thr Ala 

20 

Asp Gin Leu Asn Ala Leu Glu 
35 

Gly Arg He Glu Val Trp Asp 

50 55 

Gly Phe Ala Phe Glu Arg Phe 
65 70 

Pro Thr Phe Leu Asn Ala Gly 

85 

Gly Leu Met Gly Arg Val He 
100 

Ser Pro Val Phe Gly Glu Gly 
115 



aga ctt etc cgc ctt age get ctt cgt 960 
Arg Leu Leu Arg Leu Ser Ala Leu Arg 
315 320 

atg gtg eta ccg caa tgg aac gta aac 1008 
Met Val Leu Pro Gin Trp Asn Val Asn 
330 335 

aca aac gga aag get cat ata caa atg 1056 
Thr Asn Gly Lys Ala His He Gin Met 
345 350 

gtg ttc gac caa gag ate tee age gga 1104 

Val Phe Asp Gin Glu He Ser Ser Gly 

360 365 

ggc ttt teg gtc atg aaa eat cgc ata 1152 

Gly Phe Ser Val Met Lys His Arg He 
380 

gaa ttc aag aca aac gaa aac gca cag 1200 

Glu Phe Lys Thr Asn Glu Asn* Ala Gin 
395 400 

ace tea gtc atg aga ggt ttg eeg ctt 1248 
Thr Ser Val Met Arg Gly Leu Pro Leu 
•410 415 

cag ate tet cec gaa gaa get aaa ega 1296 
Gin He Ser Pro Glu Glu Ala Lys Arg 
425 430 

ace aca etg acc cat age agt eca atg 1344 
Thr Thr Leu Thr His Ser Ser Pro Met 
440 445 

tga 13 68 



He Ser 

Gin Gin 
25 

Pro Ser 
40 

His His 

Val He 

Lys Leu 

Pro Gly 
105 

Gin Gly 
120 



Phe Ser Leu Thr 
10 

Trp Pro Asn Glu 



Gin He He Lys 
45 

Ala Pro Gin Leu 
60 

Glu Pro Gin Gly 
75 

Thr Phe Val Val 
90 

Cys Ala Glu Thr 

Gin Gly Gin Ser 
125 



Leu Leu He 
15 

Cys Gin Leu 
30 

Ser Glu Gly 



Arg Cys Ser 

Leu Phe Leu 
80 

His Gly Arg 
95 

Phe Met Glu 
110 

Gin Gly Phe 
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Arg Asp Met His Gin Lys Val Glu His Leu Arg Cys Gly Asp Thr He 
130 135 140 

Ala Thr Pro Ser Gly Val Ala Gin Trp Phe Tyr Asn Asn Gly Asn Glu 
145 150 155 160 

Pro Leu He Leu Val Ala Ala Ala Asp Leu Ala Ser Asn Gin Asn Gin 
165 170 175 

Leu Asp Arg Asn Leu Arg Pro Phe Leu He Ala Gly Asn Asn Pro Gin 
180 185 190 

Gly Gin Glu Trp Leu Gin Gly Arg Lys Gin Gin Lys Gin Asn Asn He 
195 200 205 

Phe Asn Gly Phe Ala Pro Glu He Leu Ala Gin Ala Phe Lys He Asn 

210 215 220 

Val Glu Thr Ala Gin Gin Leu Gin Asn Gin Gin Asp Asn Arg Gly Asn 
225 230 235 240 

He Val Lys Val Asn Gly Pro Phe Gly Val He Arg Pro Pro Leu Arg 
245 250 255 

Arg Gly Glu Gly Gly Gin Gin Pro His Glu He Ala Asn Gly Leu Glu 

260 265 270 

Glu Thr Leu Cys Thr Met Arg Cys Thr Glu Asn Leu Asp Asp Pro Ser 
275 280 285 

Asp Ala Asp Val Tyr Lys Pro Ser Leu Gly Tyr He Ser Thr Leu Asn 
290 295 300 

Ser Tyr Asn Leu Pro He Leu Arg Leu Leu Arg Leu Ser Ala Leu Arg 
305 310 315 320 

Gly Ser He Arg Lys Asn Ala Met Val Leu Pro Gin Trp Asn Val Asn 

325 330 . 335 

Ala Asn Ala Ala Leu Tyr Val Thr Asn Gly Lys Ala His He Gin Met 
340 345 350 

Val Asn Asp Asn Gly Glu Arg Val Phe Asp Gin Glu He Ser Ser Gly 
355 360 365 

Gin Leu Leu Val Val Pro Gin Gly Phe Ser Val Met Lys His Arg He 
370 375 380 

Gly Glu Gin Phe Glu Trp He Glu Phe Lys Thr Asn Glu Asn Ala Gin 
385 390 395 400 

Val Asn Thr Leu Ala Gly Arg Thr Ser Val Met Arg Gly Leu Pro Leu 

405 410 415 

Glu Val He Thr Asn Gly Tyr Gin He Ser Pro Glu Glu Ala Lys Arg 
420 425 430 

Val Lys Phe Ser Thr He Glu Thr Thr Leu Thr His Ser Ser Pro Met 
435 440 445 

Ser Tyr Gly Arg Pro Arg Ala 
450 455 



<210> 67 
<211> 1356 
<212> DNA 

<213> Arabidopsis tlialiana 
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<220> 

<221> CDS 

<222> (1) . . (1353) 

<223> putative 12 S storage protein 
<400> 67 

atg cat aag ctt ttg ttt tct ctt etc tec gtc gtc tea etc tea ttt 48 
Met His Lys Leu Leu Plie Ser Leu Leu Ser Val Val Ser Leu Ser Ph.e 

1 5 -10 15 

etc etc tte ttc cat gge gee gag gca cgc cag cga gag gcg ceg ttt 96 
Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala Pro Phe 

20 25 30 

cca aac gee tgc cat ttc age caa ate aac age etc gcg ecc get cag 144 
Pro Asn Ala Cys His Phe Ser Gin He Asn Ser Leu Ala Pro Ala Gin 

35 40 45 

gcg aeg aag ttc gaa gee ggt cag atg gaa gta tgg gae eac atg age 192 
Ala Thx Lys Ptie Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 

50 55 60 

cct gag etc cga tgc gee ggt gta aeg gtg get cgc ate ace ctt cag 240 
Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg He Thr* Leu Gin 
65 70 75 80 

ecc aat tec att tte ttg ecc get ttc ttt age cca cct gee ctt get 288 
Pro Asn Ser He Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 

85 90 . 95 

tac gtt gtc caa gga gaa gga gtt atg ggg aeg att get tct ggt tgt 336 
Tyr Val Val Gin Gly Glu Gly Val Met Gly Thr He Ala Ser Gly Cys 

100 105 110 

cct gag act ttt gca gaa gtt gaa gga tea tea gga aga gga gga gga 384 
Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 

115 120 125 

gga gae ceg ggt cga cgt ttt gag gae atg eac cag aag ttg gag aat 432 
Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin Lys Leu Glu Asn 

130 135 140 

ttc egg cga ggg gat gtg ttt get teg ctt gee gga gtt tea cag tgg 480 
Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin Trp 
145 150 155 160 

tgg tac aac cgc ggt gat tee gat gee gtc att gtc att gtt ctt gat 528 
Trp Tyr Asn Arg Gly Asp Ser Asp Ala -Val He Val He Val Leu Asp 

165 17.0 175' 

gtc ace aac aga gaa aac cag ctt gae caa gtc cct agg atg tte caa 576 
Val Thr Asn Arg Glu Asn Gin Leu Asp Gin Val Pro Arg Met Phe Gin 

180 185 190 

eta gee ggg age aga aeg caa gaa gaa gaa caa cca tta aeg tgg cca 624 
Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu Thr Trp Pro 

195 200 205 

tea gge aac aac get ttc age ggt ttc gae cca aac ata ate gcg gaa 672 
Ser Gly Asn Asn Ala Phe Ser Gly Phe Asp Pro Asn He He Ala Glu 

210 215 220 

gca tte aaa ate aac ate gag aea get aag caa eta caa aac cag aag 720 
Ala Phe Lys He Asn He Glu Thr Ala Lys Gin Leu Gin Asn Gin Lys 
225 230 235 240 

gae aac aga gga aac ata ate cga gca aat ggt cct etc eat tte gtc 768 
Asp Asn Arg Gly Asn He He Arg Ala Asn Gly Pro Leu His Phe Val 
245 250 255 
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ate cca ccg cct cgt gaa tgg cag caa gat ggc att get aat ggc ate 816 
lie Pro Pro Pro Arg Glu Trp Gin Gin Asp Gly lie Ala Asn Gly lie 
260 265 270 

gaa gag act tat tgc acg get aag att cat gag aat ate gat gat cca 864 
Glu Glu Thr Tyr Cys Tlir Ala Lys lie His Glu Asn lie Asp Asp Pro 
275 280 285 

gaa egg -tct gac cat ttt age aea cga gee gga aga ate age act ett 912 
Glu Arg Ser Asp His Phe Ser Thr Arg Ala Gly Arg lie Ser Thr Leu 
290 295 300 

aac age ett aat . etc cct gtt eta cgt eta gte aga ett aac gee ett 960 
Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 
.305 310 315 320 

aga ggt tat etc tac age gga gga atg gtg ttg cca caa tgg acg gca 1008 
Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 
325 . 330 335 

aac gcg cac acg gtg eta tac gte aea gga ggt caa gee aag ata caa 1056 
Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys lie Gin 
340 345 350 

gtg gtg gac gac aat ggt cag teg gtg ttc aat gag caa gtg gga caa 1104 
Val Val Asp Asp Asn Gly Gin Ser Val Phe Asn Glu Gin Val Gly Gin 
355 360 365 

ggc caa ate att gtg att cca caa ggc ttt gca gtt tea aaa acg get 1152 
Gly Gin lie lie Val lie Pro Gin Gly Phe Ala Val Ser Lys Thr Ala 
370 375 380 

ggt gaa acg ggt ttc gag tgg ata tea ttc aag aca aac gat aac get 1200 
Gly Glu Thr Gly Phe Glu Trp lie Ser Phe Lys Thr Asn Asp Asn Ala 
385 390 395 400 

tac att aac aca etg age ggc caa aca teg tac ttg aga gca gtt cca 1248 
Tyr lie Asn Thr Leu Ser Gly Gin Thr Ser Tyr Leu Arg Ala Val Pro 
405 410 415 

gtg gat gtg ate aaa gcg tea tat gga gtg aac gag gaa gaa gee aag 1296 
Val Asp Val lie Lys Ala Ser Tyr Gly Val Asn Glu Glu Glu Ala Lys 
420 425 430 

agg ate aag ttt agt cag caa gag ace. atg ttg tct atg aca cca age 1344 
Arg lie Lys Phe Ser Gin Gin Glu Thr Met Leu Ser Met Thr Pro Ser 
435 440 445 

tct tct tct taa 1356 
Ser Ser Ser 
450 

<210> 68 
<211> 451 
<212> PRT 

<213> Arabidopsis thaliana 

<400> 68 

Met His Lys Leu Leu Phe Ser Leu Leu Ser Val Val Ser Leu Ser Phe 
15 10 15 

Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala Pro Phe 
20 25 30 

Pro Asn Ala Cys His Phe Ser Gin lie Asn Ser Leu Ala Pro Ala Gin 
35 40 45 
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Ala Thr Lys Phe Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 

50 55 60 

Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg lie Thr Leu Gin 
^5 70 75 80 

Pro Asn Ser lie Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 

85 90 95 

Tyr Val Val Gin Gly Glu Gly Val Met Gly Thr He Ala Ser Giy Cys 
100 105 110 

Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 
115 120 125 

Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin Lys Leu Glu Asn 
130 135 140 

Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin Trp 
145 150 155 160 

Trp Tyr Asn Arg Gly Asp Ser Asp Ala Val He Val He Val Leu Asp 

165 170 175 

Val Thr Asn Arg Glu Asn Gin Leu Asp Gin Val Pro Arg Met Phe Gin 
180 185 . 190 

Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu Thr Trp Pro 
195 200 205 

Ser Gly Asn Asn Ala Phe Ser Gly Phe Asp Pro Asn He He Ala Glu 
210 215 220 

Ala Phe Lys He Asn He Glu Thr Ala Lys Gin Leu Gin Asn Gin Lys 
225 230 235 240 

Asp Asn Arg Gly Asn He He Arg Ala Asn Gly Pro Leu His Phe Val 

245 250 255 

He Pro Pro Pro Arg Glu Txp Gin Gin Asp Gly He Ala Asn Gly He 
260 265 270 

Glu Glu Thr Tyr Cys Thr Ala Lys He His Glu Asn He Asp Asp Pro 
275' 280 285 

Glu Arg Ser Asp His Phe Ser Tlir Arg Ala Gly Arg He Ser Thr Leu 
290 295 300 

Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 
305 310 315 320 

Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 

325 330 335 

Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys He Gin 
340 345 350 

Val Val Asp Asp Asn Gly Gin Ser Val Phe Asn Glu Gin Val Gly Gin 

355 360 365 ' 

Gly Gin He He Val He Pro Gin Gly Phe Ala Val Ser Lys Thr Ala 
370 375 380 

Gly Glu Thr Gly Phe Glu Trp He Ser Phe Lys Thr Asn Asp Asn Ala 

385 390 395 400 

Tyr He Asn Thr Leu Ser Gly Gin Thr Ser Tyr Leu Arg Ala Val Pro 

405 410 415 

Val Asp Val He Lys Ala Ser Tyr Gly Val Asn Glu Glu Glu Ala Lys 

420 425 430 
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Arg lie Lys Phe Ser Gin Gin Glu Thr Met Leu Ser Met Thr Pro Ser 

435 440 445 

Ser Ser Ser 
450 



<210> 69 
<211> 1356 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1353) 

<223> 12S storage protein Atlg03890 
<400> 69 

atg cat aag ctt ttg ttt tct ctt etc tec gtc gtc tea etc tea ttt 48 
Met His Lys Leu Leu Phe Ser Leu Leu Ser Val Val Ser Leu Ser Phe 

1 5 10 * 15 

etc etc tte ttc cat gge gee gag gea cgc cag cga gag geg ccg ttt 96 
Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala Pro Phe 
20 25 30 

cca aac gcc tgc cat ttc age caa ate aac age etc gcg ccc get cag 144 
Pro Asn Ala Cys His Phe Ser Gin lie Asn Ser Leu Ala Pro Ala Gin 
35 40 45. 

gcg aeg aag ttc gaa gee ggt cag atg gaa gta tgg gae cac atg age 192 
Ala Thr Lys Phe Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 
50 55 60 

cct gag etc cga tgc gcc ggt gta aeg gtg get cgc ate ace ctt cag 240 
Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg lie Thr Leu Gin 
65 70 75 80 

ccc aat tec att ttc ttg ccc get tte ttt age cca cct gee ctt get 288 
Pro Asn Ser lie Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 

85 90 95 

tac gtt gtc caa gga gaa gga gtt atg ggg aeg att get tct ggt tgt 336 
Tyr Val Val Gin Gly Glu Gly Val Met Gly Thr He Ala Ser Gly Cys 
100 105 110 

cct gag act ttt gea gaa gtt gaa gga tea tea gga aga gga gga gga 384 
Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 
115 120 125 

gga gac ccg ggt cga cgt ttt gag gac atg cac cag aag ttg gag aat 432 
Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin. Lys Leu Glu Asn 

130 135 140 

ttc egg cga ggg gat gtg ttt get teg ctt gcc gga gtt tea cag tgg 480 
Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin T3rp 
145 150 155 160 

tgg tac aac cgc ggt gat tec gat gee gtc att gtc att gtt ctt gat 528 
Trp Tyr Asn Arg Gly Asp Ser Asp Ala Val He Val He Val Leu Asp 
165 170 175 

gtc ace aac aga gaa aac cag ctt gac caa gtc cct agg atg ttc caa 576 
Val Thr Asn Arg Glu Asn Gin Leu Asp Gin Val Pro Arg Met Phe Gin 
180 185 190 
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eta gcc ggg age aga acg caa gaa gaa gaa caa cca tta acg tgg cca 624 
Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu TQar Trp Pro 
195 200 205 

tea ggc aac aac get ttc age ggt ttc gac cca aac ata ate gcg gaa 672 
Ser Gly Asn Asn Ala Pbe Ser Gly Ph.e Asp Pro Asn lie lie Ala Glu 
210 215 220 

gca ttc aaa ate aac ate gag aca get aag caa eta caa aac cag aag 720 
Ala Phe Lys lie Asn lie Glu Tlir Ala Lys Gin Leu Gin Asn Gin Lys 

225 230 235 240 

gac aac aga gga aac ata ate cga gca aat ggt cet etc cat ttc gtc 768 
Asp Asn Arg Gly Asn lie lie Arg Ala Asn Gly Pro Leu His Plie Val 
245 250 255 

ate cca eeg ect egt gaa tgg cag caa gat ggc att get aat ggc ate 816 

lie Pro Pro Pro Arg Glu Trp Gin Gin Asp Gly lie Ala Asn Gly lie 
260 265 270 

gaa gag act tat tge acg get aag att cat gag aat ate gat gat cca 864 

Glu Glu Thx Tyr Cys Thr Ala Lys lie His Glu Asn lie Asp Asp Pro 
275 280 285 

gaa egg tct gac cat ttt age aca cga gee gga aga ate age act ctt 912 

Glu Arg Ser Asp His Phe Ser Thr Arg Ala Gly Arg lie Ser Thr Leu 
290 295 300 

aac age ctt aat etc ect gtt eta egt eta gtc aga ctt aac gee ctt 960 

Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 

305 310 315 320 

aga ggt tat etc tac age gga gga atg gtg ttg cca caa tgg acg gca 1008 

Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 

325 330 335 

aac gcg cac acg gtg eta tac gtc aca gga ggt caa gee aag ata caa 1056 

Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys lie Gin 
340 345 350 

gtg gtg gac gac aat ggt cag teg gtg ttc aat gag caa gtg gga caa 1104 

Val Val Asp Asp Asn Gly Gin Ser Val Phe Asn Glu Gin Val Gly Gin 
355 360 365 

ggc caa ate att gtg att cca caa ggc ttt gca gtt tea aaa acg get 1152 

Gly Glri He He Val He Pro Gin Gly Phe Ala Val Ser Lys Thr Ala 
370 375 380 

ggt gaa acg ggt ttc gag tgg ata tea ttc aag aca aac gat aac get 1200 

Gly Glu Thr Gly Phe Glu Trp He Ser Phe Lys Thr Asn Asp Asn Ala 

385 390 395 400 

tac att aac aca ctg age ggc caa aca teg tac ttg aga gca gtt cca 1248 

Tyr He Asn Thr Leu Ser Gly Gin Thr Ser Tyr Leu Arg Ala Val Pro 
405 410 415 

gtg gat gtg ate aaa geg tea tat gga gtg aac gag gaa gaa gee aag 1296 

Val Asp Val He Lys Ala Ser Tyr Gly Val* Asn Glu Glu Glu Ala Lys 

420 425 430 

agg ate aag ttt agt cag caa gag ace atg ttg tct atg aca cca age 1344 

Arg He Lys Phe Ser Gin Gin Glu Thr Met Leu Ser Met Thx: Pro Ser 
435 440* 445 

tct tct tct taa 1356 
Ser Ser Ser 
450 
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<210> 70 
<211> 451 
<212> PRT 

<213> Arabidopsis thalicma 
<400> 70 

Met His Lys Leu Leu Phe Ser Leu Leu Ser Val Val Ser Leu Ser Phe 
1 5 10 15 

Leu Leu Phe Phe His Gly Ala Glu Ala Arg Gin Arg Glu Ala Pro Phe 

20 . 25 30 . 

Pro Asn Ala Cys His Phe Ser Gin lie Asn Ser Leu Ala Pro Ala Gin 
35 40 45 

Ala Thr Lys Phe Glu Ala Gly Gin Met Glu Val Trp Asp His Met Ser 
50 55 60 

Pro Glu Leu Arg Cys Ala Gly Val Thr Val Ala Arg lie Thr Leu Gin 
65 70 75 80 

Pro Asn Ser lie Phe Leu Pro Ala Phe Phe Ser Pro Pro Ala Leu Ala 

85 90 95 

Tyr Val Val Gin Gly Glu Gly Val Met Gly Thr lie Ala Ser Gly Cys 
100 105 110 

Pro Glu Thr Phe Ala Glu Val Glu Gly Ser Ser Gly Arg Gly Gly Gly 

115 120 125 

Gly Asp Pro Gly Arg Arg Phe Glu Asp Met His Gin Lys Leu Glu Asn 
130 135 140 

Phe Arg Arg Gly Asp Val Phe Ala Ser Leu Ala Gly Val Ser Gin Trp 
145 150 155 160 

Trp Tyr Asn Arg Gly Asp Ser Asp Ala Val lie Val lie Val Leu Asp 

165 170 175 

Val Thr Asn Arg Glu Asn Gin Leu Asp Gin Val Pro Arg Met Phe Gin 

180 185 190 

Leu Ala Gly Ser Arg Thr Gin Glu Glu Glu Gin Pro Leu Thr Trp Pro 
195 200 205 

Ser Gly Asn Asn Ala Phe Ser Gly Phe Asp Pro Asn lie lie Ala Glu 
210 215 220 

Ala Phe Lys lie Asn lie Glu Thr Ala Lys Gin Leu Gin Asn Gin Lys 
225 230 235 240 

Asp Asn Arg Gly Asn lie lie Arg Ala Asn Gly Pro Leu His Phe Val 

245 250 255 

lie Pro Pro Pro Arg Glu Tip Gin Gin Asp Gly lie Ala Asn Gly lie 
260 265 270 

Glu Glu Thr Tyr Cys Thr Ala Lys lie His Glu* Asn lie Asp Asp Pro 
275 280 285 

Glu Arg Ser Asp His Phe Ser Thr Arg Ala Gly Arg lie Ser Thr Leu 
290 295 300 

Asn Ser Leu Asn Leu Pro Val Leu Arg Leu Val Arg Leu Asn Ala Leu 
305 310 315 320 

Arg Gly Tyr Leu Tyr Ser Gly Gly Met Val Leu Pro Gin Trp Thr Ala 

325 330 335 

Asn Ala His Thr Val Leu Tyr Val Thr Gly Gly Gin Ala Lys lie Gin 
340 345 350 
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Val Val Asp Asp Asn Gly Gin Ser 
355 360 

Gly Gin lie lie Val lie Pro Gin 
370 375 

Gly Glu Thr Gly Phe Glu Trp lie 
385 390 

Tyr lie Asn Tlir Leu Ser Gly Gin 
405 

Val Asp Val lie Lys Ala Ser Tyr 
420 

Arg lie Lys Phe Ser Gin Gin Glu 
435 440 

Ser Ser Ser 
450 
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Val Phe Asn Glu Gin Val Gly Gin 
365 

Gly Phe Ala Val Ser Lys Thr Ala 
380 

Ser Phe Lys Thr Asn Asp Asn Ala 
395 . 400 

Thr Ser Tyr Leu Arg Ala Val Pro 
410 415 

Gly Val Asn Glu Glu Glu Ala Lys 
425 430 

Thr Met Leu Ser Met Thr Pro Ser 
445 



<210> 71 
<211> 867 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) • . (864) 

<223> prohibitin 1 

<400> 71 

atg aac aac gtc aaa gtt cca aag ata cca ggt ggt ggt gcc att teg 48 
Met Asn Asn Val Lys Val Pro Lys He Pro Gly Gly Gly Ala He Ser 
15 10 15 

acg ttg ctt aag gtt ggg att att ggt ggg ctt ggc etc tat ggt get 96 
Thr Leu Leu Lys Val Gly He He Gly Gly Leu Gly Leu Tyr Gly Ala 
20 25 30 

acg cac agt etc tac aat gtt gaa gga gga cat cga gcc ate atg ttc 144 
Thr His Ser Leu Tyr Asn Val Glu Gly Gly His Arg Ala He Met Phe 
35 40 45 

aat cgt tta gtc ggt att aaa gat aag gtt tac cct gag ggt aca cac • 192 
Asn Arg Leu Val Gly He Lys Asp Lys Val Tyr Pro Glu Gly Thr His 
50 55 60 

ctt atg att cct tgg ttt gaa agg ccg gtc ate tat gac gtt cgt get 240 
Leu Met He Pro Trp Phe Glu Arg Pro Val He Tyr Asp Val Arg Ala 
65 70 75 80 

cga cct tac ctt gtt gag agt aca tec gga age cgt gat ctt eag atg 288 
Arg Pro Tyr Leu Val Glu Ser Thr Ser Gly Ser Arg Asp Leu Gin Met 

85 90 95 

gtg aaa att ggg ctt agg gtt etc aca cgt cce atg gea gac eag tta 33 6 
Val Lys He Gly Leu Arg Val Leu Thr Arg Pro Met Ala Asp Gin Leu 
100 105 110 

cct gaa ate tac aga age ctt ggt gag aac tac age gag aga gtt eta 384 
Pro Glu He Tyr Arg Ser Leu Gly Glu Asn Tyr Ser Glu Arg Val Leu 
115 120 125 

cct tet ata ate aac gag act ttg aaa get gtg gtt get cag tac aat 432 
Pro Ser He He Asn Glu Thr Leu Lys Ala Val Val Ala Gin Tyr Asn 
130 135 140 



3NSDOCID: <WO ^0307862gA1J_> 



wo 03/078629 PCT/EP03/02735 

84 

gca age cag ctt att act cag aga gag gcg gtc agt agg gag ate agg 480 
Ala Ser Gin Leu lie Tlir Gin Arg Glu Ala Val Ser Arg Glu lie Arg 
145 150 155 160 

aag att ctg aet gaa cga gea gea aac tte aat gtt gcg ctt gae gat 528 
Lys lie Leu Thr Glu Arg Ala Ala Asn Phe Asn Val Ala Leu Asp Asp 
165 170 175 

gtg tec ate aea aae etg aca tte ggg aag gag tte aea get gcc att 576 
Val Ser lie Thr Asn Leu Thr Phe Gly Lys Glu Phe Thr Ala Ala lie 
180 185 190 

gaa gca aag cag gtg gcg get caa gag get gag egg get aag tte att 624 
Glu Ala Lys Gin Val Ala Ala Gin Glu Ala Glu Arg Ala Lys Phe lie. 
195 200 205 

gtt gag aag gee gaa caa gae aag aga agt get gtt ate cge gee cag 672 
Val Glu Lys Ala Glu Gin Asp Lys Arg Ser Ala Val He Arg Ala Gin 
210 215 220 

gga gaa gee aag agt get cag etc att ggt caa gca att gca aac aac 720 
Gly Glu Ala Lys Ser Ala Gin Leu He Gly Gin Ala He Ala Asn . Asn 
225 230 235 240" 

caa gcg ttt ate aeg etc agg aag ate gag get gca aga gag att gca 768 
Gin Ala Phe He Thr Leu Arg Lys He Glu Ala Ala Arg Glu He Ala 

245 250 255 

cag ace ata gca aae teg gcg aac aag gtt tac ttg age tea gae gat 816 
Gin Thr He Ala Asn Ser Ala Asn Lys Val Tyr Leu Ser Ser Asp Asp 
260 265 270 

ctt ttg ctt aac eta caa ggg atg aat ttg gat gtt gat gca .aag aac 864 
Leu Leu Leu Asn Leu Gin Gly Met Asn Leu Asp Val Asp Ala Lys Asn 
275 280 285 

tag 867 

<210> 72 
<211> 288 
<212> PRT 

<213> Aratoidopsis thaliana 
<400> 72 

Met Asn Asn Val Lys Val Pro Lys He Pro Gly Gly Gly Ala He Ser 
15 10 15 

Thr Leu Leu Lys Val Gly He He Gly Gly Leu Gly Leu Tyr Gly Ala 
20 25 30 

Thr His Ser Leu Tyr Asn Val Glu Gly Gly His Arg Ala He Met Phe 
35 40 45 

Asn Arg Leu Val Gly He Lys Asp Lys Val Tyr Pro Glu Gly Thr His 
50 55 60 

Leu Met He Pro Trp Phe Glu Arg Pro Val He Tyr Asp Val Arg Ala 
65 70 75 80 

Arg Pro Tyr Leu Val Glu Ser Thr Ser Gly Ser Arg Asp Leu Gin Met 

85 90 95 

Val Lys He Gly Leu Arg Val Leu Thr Arg Pro Met Ala Asp Gin Leu 
.100 105 110 

Pro Glu He Tyr Arg Ser Leu Gly Glu Asn Tyr Ser Glu Arg Val Leu 
115 120 125 
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Pro Ser lie lie Asn Glu Thr Leu Lys Ala Val Val Ala Gin Tyr Asn 
130 135 140 

Ala Ser Gin Leu lie Thr Gin Arg Glu Ala Val Ser Arg Glu lie Arg 
145 150 155 . 160 

Lys lie Leu Thr Glu Arg Ala Ala Asn Phe Asn Val Ala Leu Asp Asp 
165 170 175 

Val Ser He Thr Asn Leu Thr Phe Gly Lys Glu Phe Thr Ala Ala He . 
180 185 190 

Glu Ala Lys Gin Val Ala Ala Gin Glu Ala Glu Arg Ala Lys Phe He 
195 200 205 

Val Glu Lys Ala Glu Gin Asp Lys Arg Ser Ala Val He Arg Ala Gin 
210 215 220 

Gly Glu Ala Lys Ser Ala Gin Leu -He Gly Gin Ala He Ala Asn Asn 
225 230 235 240 

Gin Ala Phe He Thr Leu Arg Lys He Glu Ala Ala Arg Glu He Ala 
245 250 255 

Gin Thr He Ala Asn Ser Ala Asn Lys Val Tyr Leu Ser Ser Asp Asp 

260 * 265 270 

Leu Leu Leu Asn Leu Gin Gly Met Asn Leu Asp Val Asp Ala Lys Asn 
275 280 285 

<210> 73 
<211> 40 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der 3cunstlichen Sequenz: 
oligonucleotid primer 

<400> 73 

ataagaatgc ggccgcgtgt tccatttggc cggaaacaac 40 

<210> 74 

<211> 33 
<212> DNA 

<213> Kunstliche Sequenz 

<220> 

<223> Beschreibimg der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 74 

cccggatcct tctgtaacat ttgacaaaac atg 33 

<210> 75 
<211> 40 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 75 

ataagaatgc ggccgcgtgt tccatttggc cggaaacaac 40 

<210> 76 
<211> 44 
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<212> DNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Beschxeibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 76 

ataagaatgc ggccgcggat ccaccctgga gaacgccacg agtg 44 

<210> 77 
<211> 45 
<212> DNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Besclireibiing der Iciinstliclien Sequenz: 
oligonucleotid primer 

<400> 77 

ataagaatgc ggccgcggat ccctcagggt cttttcttgc ccact 45 

<210> 78 
<211> 30 
<212> DNA • 

<213> Kiinstliclie Sequenz 
<220> 

<223> Besclireibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 78 

ccgctcgagt ttacggatgg agccacgaag 30 

<210> 79 
<211> 30 
<212> DNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Besclireibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 79 

ccgctcgagg taagctcaac aaatctttag 30 

<210> 80 
<211> 31 
<212> DNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotid primer 

<400> 80 

acgcgtcgac gcgttctgcg tgcaagatat t 31 

<210> 81 
<211> 46 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotid primer 
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<400> 81 

ataagaatgc ggccgcggat ccatggctaa caagctcttc ctcgtc 46 

<210> 82 
<211> 45 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Besclireibimg der kiinstliclieii Sequenz: 
oligonucleotid primer 

<400> 82 

ataagaatgc ggccgcggat ccctagtagt aaggagggaa- gaaag 45 

'<210> 83 
<211> 4954 
<212> DNA 

<213> Kiinstliche Sequenz 

<220> 

<223> Beschreibung der loins tlichen .Sequenz : DNA 

construct coding for dsRNA for suppression of 
multiple storage- proteins 

<400> 83 

agcttggtac cgagctcgga tccactagta acggccgcca gtgtgctgga attcgccctt 60 
gcggccgcgt gttccatttg gccggaaaca accagcaggg aggctttggc ggttcacagc 120 
aacaacaaga acagaaaaac ttgtggagcg ggttcgacgc acaggtcata gctcaagcat 180 
tgaaaattga cgttcagttg gctcagcagc ttcagaacca acaagacagc agaggaaaca 240 
tcgttcgtgt taagggacct ttccaggtcg tgaggccacc tctaagacag ccctacgaga 3 00 
gcgaggagtg gagacaccca cgtagcccac agggcaacgg ccttgaggag actatctgca 3 60 
gcatgaggtc ccacgagaac attgacgacc ctgctcgtgc tgacgtgtac aagcccagcc 420 
taggtcgcgt gaccagcgtc aacagctata ccttgcccat cttggagtat gtcaggctca 480 
gtgccactcg tggcgttctc cagggtggat ccttctgtaa catttgacaa aacatgtgaa 540 
cacgtcatcc gtcatataga acttccaatt ttaatatgtt ttgctaaaga aaaaaaaaag 600 
gaataaatat ctatcaaatt catttttaaa acatttgtat acgttcttaa ataatttagg 660 
atatgactaa tttttctttt tggtaaaaat gttaatatct atatttaatt tattaagaaa 720 
aatgtactta caccctggag aacgccacga gtggcactga gcctgacata ctccaagatg 780 
ggcaaggtat agctgttgac gctggtcacg cgacctaggc tgggcttgta cacgtcagca 840 
cgagcagggt cgtcaatgtt ctcgtgggac ctcatgctgc agatagtctc ctcaaggccg 900 
ttgccctgtg ggctacgtgg gtgtctccac tcctcgctct cgtagggctg tcttagaggt 960 
ggcctcacga cctggaaagg tcccttaaca cgaacgatgt ttcctctgct gtcttgttgg 1020 
ttctgaagct gctgagccaa ctgaacgtca attttcaatg cttgagctat gacctgtgcg 1080 
tcgaacccgc tccacaagtt tttctgttct tgttgttgct gtgaaccgcc aaagcctccc li40 
tgctggttgt ttccggccaa atggaacacg cggccgcaag ggcgaattct gcagatatcc 1200 
atcacactgg cggccgctcg acgtaagctc aacaaatctt tagaaaatta attttatgtg 1260 
acatatgcaa taatttgatt tggcaagata aactaataga ttttgcgatt tggagtttta 1320 
aactctaaat aatctaaatc gttttcaatt ggtttaaata tatatcttgc atttttaatc 1380 
gtttttaatt aaaaaatata tatatatata tatatcttgc atttttaatc gttttcaatt 1440 
taaaaaatat cttgcacgca gaacgctctc gagcggccgc ggatcctcag ggtcttttct 1500 
tgcccacttt cttgaacgcc ggcaaactca cgtttgttgt tcacggaagg ggtctaatgg 1560 
gaagagttat tccgggatgc gccgagacgt tcatggagtc accggtattt ggagaaggtc 1620 
aaggtcaggg tcagagtcaa gggttccgtg acatgcacca gaaagtagag cacctacggt 1680 
gcggtgacac cattgcaaca ccatctggtg tagctcaatg gttctacaac aatggaaatg 1740 
agcctctcat tcttgttgca gccgcggatc tcgccagcaa ccagaaccag cttgaccgca 180 0 
accttagac.c atttttgata gccggaaaca acccacaagg gcaggaatgg ctacaaggcc 1860 
gaaagcaaca gaagcaaaac aacatcttca atggcttcgc acctgagatc ttggctcaag 192 0 
ccttcaagat caatgtcgag acggctcagc agctccagaa ccagcaagat aaccgtggca 1980 
acatcgtcaa ggtcaacgga cctttcggcg tcattaggcc acccttgaga cgcggcgaag 2040 
gcggccaaca accacatgaa atagctaatg gtttagagga gactttgtgc accatgcgat 2100 
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gcactgaaaa cctcgatgac ccgtcggatg ctgacgtgta caagccatca ctcggataca 2160 
ttagcacact taacagctac aatcttccta tcctcagact tctccgcctt agcgctcttc 222 0 
gtggctccat ccg-taaaact cgaggtaagc tcaacaaatc tttagaaaat taattttatg 2280 
tgacatatgc aataatttga tttggcaaga taaactaata gattttgcga tttggagttt 2340 
taaactctaa ataatctaaa tcgttttcaa ttggtttaaa tatatatctt gcatttttaa 2400 
tcgtttttaa ttaaaaaata tatatatata tatatatctt gcatttttaa tcgttttcaa 2460 
tttaaaaaat atcttgcacg cagaacgctg tcgagtttta cggatggagc cacgaagagc 2520 
gctaaggcgg agaagtctga ggataggaag attgtagctg ttaagtgtgc taatgtatcc 2580 
gagtgatggc ttgtacacgt cagcatccga cgggtcatcg aggttttcag tgcatcgcat 2 640 
ggtgcacaaa gtctcctcta aaccattagc tatttcatgt ggttgttggc cgccttcgcc 2700 
gcgtctcaag ggtggcctaa tgacgccgaa aggtccgttg accttgacga tgttgccacg 2760 
gttatcttgc tggttctgga gctgctgagc cgtctcgaca ttgatcttga aggcttgagc 2820 
caagatctca ggtgcgaagc cattgaagat gttgttttgc ttctgttgct ttcggccttg 2880 
tagccattcc tgcccttgtg ggttgtttcc ggctatcaaa aatggtctaa ggttgcggtc 2940 
aagctggttc tggttgctgg cgagatccgc ggctgcaaca agaatgagag gctcatttcc 3000 
attgttgtag aaccattgag ctacaccaga tggtgttgca atggtgtcac cgcaccgtag 3060 
gtgctctact ttctggtgca tgtcacggaa cccttgactc tgaccctgac cttgaccttc 3120 
tccaaatacc ggtgactcca tgaacgtctc ggcgcatccc ggaataactc ttcccattag 3180 
accccttccg tgaacaacaa acgtgagttt gccggcgttc aagaaagtgg gcaagaaaag 3240 
accctgagga tccgcggccg cgcatgcatc tagctcgagg taagctcaac aaatctttag 3 3 00 
aaaattaatt ttatgtgaca* tatgcaataa tttgatttgg cciagataaac taatagattt 3360 
tgcgatttgg agttttaaac tctaaataat ctaaatcgtt ttcaattggt ttaaatatat 3420 
atcttgcatt tttaatcgtt tttaattaaa aaatatatat atatatatat atcttgcatt 3480 
tttaatcgtt ttcaatttaa aaaatatctt gcacgcagaa cgctagggcc gcggccgcgg 3540 
atccatggct aacaagctct tcctcgtctg cgcaactctc gccctctgct tcctcctcac 3600 
caacgcttcc atctaccgca ccgttgtcga attcgaagaa gatgacgcca gcaaccccgt 3 660 
aggtccaaga cagagatgcc agaaggagtt tcagcaatca caacacctaa gagcttgcca 3720 
gagatggatg agcaagcaaa tgaggcaagg acgtggtggt ggtccttccc tcgacgatga 3780 
gttcgatttc gagggccccc agcagggata ccagctactc cagcagtgct gcaacgagct 3 840 
tcgccaggaa gagccagttt gcgtttgccc caccttgaaa caagctgcca gggcagttag 3900 
cctccaggga cagcacggac cattccaatc caggaaaatt taccagtcag ctaagtactt 39 60 
gcctaacatt tgcaagatcc agcaagttgg tgaatgtccc ttccagacca ccatcccttt 4020 
cttccctcct tactactagg gtactcgagg taagctcaac aaatctttag aaaattaatt 4080 
ttatgtgaca tatgcaataa tttgatttgg caagataaac taatagattt tgcgatttgg 4140 
agttttaaac tctaaataat ctaaatcgtt ttcaattggt ttaaatatat atcttgcatt 4200 
tttaatcgtt tttaattaaa aaatatatat atatatatat atcttgcatt tttaatcgtt 4260 
ttcaatttaa aaaatatctt gcacgcagaa cgctgtcgac taccctagta gtaaggaggg 4320 
aagaaaggga tggtggtctg gaagggacat tcaccaactt gctggatctt gcaaatgtta 43 80 
ggcaagtact tagctgactg gtaaattttc ctggattgga atggtccgtg ctgtccctgg 4440 
aggctaactg ccctggcagc ttgtttcaag gtggggcaaa cgcaaactgg ctcttcctgg 4500 
cgaagctcgt tgcagcactg ctggagtagc tggtatccct gctgggggcc ctcgaaatcg 4560 
aactcatcgt cgagggaagg accaccacca cgtccttgcc tcatttgctt gctcatccat 4620 
ctctggcaag ctcttaggtg ttgtgattgc tgaaactcct tctggcatct ctgtcttgga 4680 
cctacggggt tgctggcgtc atcttcttcg aattcgacaa cggtgcggta gatggaagcg 4740 
ttggtgagga ggaagcagag ggcgagagtt gcgcagacga ggaagagctt gttagccatg 4800 
gatcaattcg ccctatagtg agtcgtatta caattcactg gccgtcgttt tacaacgtcg 4860 
tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 4920 
cagctggcgt aatagcgaag aggcccgcac cgat 4954 

<210> 84 
<211> 4954 
<212> RNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstliclien Sequenz: RNA coding 
for dsRNA for suppression of multiple storage 
proteins 
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<400> 84 

agcuugguac cgagcucgga uccacuagua 
gcggccgcgu gu-uccauuug gccggaaaca 
aacaacaaga acagaaaaac uuguggagcg 
ugaaaauuga cguucaguug gcucagcagc 
■Qcguucgu'gu uaagggaccu -auccaggucg 
gcgaggagug gagacaccca cguagcccac 
gcaugagguc ccacgagaac auugacgacc 
uaggucgcgu gaccagcguc aacagcuaua 
gugccacucg uggcguucuc caggguggau 
cacgucaucc gacauauaga acuuccaauu 
gaauaaauau cuaucaaauu cauuuuuaaa 
auaugacuaa uuuuucuuuu ugguaaaaau 
aauguacuua cacccuggag aacgccacga 
ggcaagguau agcuguugac gcuggacacg 
cgagcagggu cgucaauguu cucgugggac 
uugcccugug ggcuacgugg gugucuccac 
ggccucacga ccuggaaagg ucccuuaaca 
•Qucugaagcu gcugagccaa cugaacguca 
■Qcgaacccgc uccacaaguu uuucuguucu 
ugcugguugfu uuccggccaa auggaacacg 
aucacacugg cggccgcucg acguaagcuc 
acauaugcaa uaauuugauu uggcaagaua 
aacucuaaau aaucuaaauc guuuucaauu 
guuuuuaauu aaaaaauaua uauauauaua 
uaaaaaauau cuugcacgca gaacgcucuc 
ugcccacuuu cuugaacgcc ggcaaacuca 
gaagaguuau uccgggaugc gccgagacgu 
aaggucaggg ucagagucaa ggguuccgug 
gcggugacac cauugcaaca ccaucuggug 
agccucucau ucuuguugca gccgcggauc 
accuuagacc auuuuugaua gccggaaaca 
gaaagcaaca gaagcaaaac aacaucuuca 
ccuucaagau caaugucgag acggcucagc 
acaucgucaa ggucaacgga ccuuucggcg 
gcggccaaca accacaugaa auagcuaaug 
gcacugaaaa ccucgaugac ccgucggaug 
uuagcacacu uaacagcuac aaucuuccua 
guggcuccau ccguaaaacu cgagguaagc 
ugacauaugc aauaauuuga uuuggcaaga 
uaaacucuaa auaaucuaaa ucguuuucaa 
ucguuuuuaa uuaaaaaaua uauauauaua 
uuuaaaaaau aucuugcacg cagaacgcug 
gcuaaggcgg agaagucuga ggauaggaag 
gagugauggc uuguacacgu cagcauccga 
ggugcacaaa gucuccucua aaccauuagc 
gcgucucaag ggiiggccuaa ugacgccgaa 
guuauc-uugc ugguucugga gcugcugagc 
caagaucuca ggugcgaagc cauugaagau 
uagccauucc ugcccuugug gguuguuucc 
aagcugguuc ugguugcugg cgagauccgc 
auuguuguag aaccauugag cuacaccaga 
giigcucuacu uucuggugca aigucacggaa 
uccaaauacc ggagacucca ugaacgucuc 
accccuuccg ugaacaacaa acgugaguuu 
acccugagga uccgcggccg cgcaugcauc 
aaaauuaauu nuaugagaca uaugcaauaa 
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acggccgcca gugugcugga anucgcccuu 60 
accagcaggg aggcuuuggc gguucacagc 120 
gguucgacgc acaggucaua gcucaagcau 180 
uucagaacca acaagacagc agaggaaaca 240 
ugaggccacc ucuaagacag cccuacgaga 300 
agggcaacgg ccuugaggag acuaucugca 3 60 
cugcucgugc ugacgnguac aagcccagcc 420 
ccuugcccau cuuggaguau gucaggcuca 480 
ccuucucfuaa cauuugacaa aacaugugaa 540 
uuaauauguu uugcuaaaga aaaaaaaaag 600 
acauuuguau acguucuuaa auaauuuagg 660 
guuaauaucu auauuuaauu uauuaagaaa 720 
guggcacuga gccugacaua cuccaagaug 780 
cgaccuaggc ugggcuugua cacgucagca 840 
cucaugcugc agauagucuc cucaaggccg 900 
uccucgcucu cguagggcug ucuuagaggru 960 
cgaacgaugu uuccucugcu gucuuguugg 1020 
auuuucaaug cuugagcuau gaccugugcg 1080 
uguuguugcu gugaaccgcc aaagccuccc 1140 
cggccgcaag ggcgaauucu gcagauaucc 1200 
aacaaaucuu uagaaaauua auuuuaugug 1260 
aacuaauaga uuuugcgauu uggaguuuua 1320 
gguuuaaaua uauaucuugc auuuuuaauc 1380 
uauaucuugc auuuuuaauc guuuucaauu 1440 
gagcggccgc ggauccucag ggucuuuucu 1500 
cguuuguugu ucacggaagg ggucuaaugg 1560 
ucauggaguc accgguauuu ggagaagguc 1620 
acaugcacca gaaaguagag caccuacggu 1680 
uagcucaaug guucuacaac aauggaaaug 1740 
ucgccagcaa ccagaaccag cuugaccgca 1800 
acccacaagg gcaggaaugg cuacaaggcc 1860 
auggcuucgc accugagauc uuggcucaag 1920 
agcuccagaa ccagcaagau aaccguggca 1980 
ucauuaggcc acccuugaga cgcggcgaag 2040 
guuuagagga gacuuugugc accaugcgau 2100 
cugacgugua caagccauca cucggauaca 2160 
uccucagacu ucuccgccuu agcgcucuuc 2220 
ucaacaaauc uuuagaaaau uaauuuuaug 2280 
uaaacuaaua gauuuugcga uuuggaguuu 2340 
uugguuuaaa uauauaucuu gcauuuuuaa 2400 
uauauaucuu gcauuuuuaa ucguuuucaa 2460 
ucgaguuuua cggauggagc cacgaagagc 2520 
auuguagcug uuaagugugc uaauguaucc 2 580 
cgggucaucg agguuuucag ugcaucgcau 2 640 
uauuucaugu gguuguuggc cgccuucgcc 2700 
agguccguug accuugacga uguugccacg 2760 
cgucucgaca uugaucuuga aggcuugagc 2 820 
c[uuguuuugc uucuguugcu uucggccuug 2880 
ggcuaucaaa aauggucuaa gguugcgguc 2940 
ggcugcaaca agaaugagag gcucauuucc 3000 
ugguguugca auggugucac cgcaccguag 3 060 
cccuugacuc ugacccugac cuugaccuuc 3120 
ggcgcauccc ggaauaacuc uucccauuag 3180 
gccggcguuc aagaaagugg gcaagaaaag 3240 
uagcucgagg uaagcucaac aaaucuuuag 3300 
uuugauuugg caagauaaac uaauagauuu 3360 
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ugcgauuugg 
aucuugcauu 
uuuaaucgiiu 
auccauggcu 
caacgcuucc 
agguccaaga 
gagauggaug 
guucgauuuc 
ucgccaggaa 
ccuccaggga 
gccuaacauu 
cuucccuccu 
uuaugugaca 
aguuuuaaac 
uuuaaucguu 
uucaauuuaa 
aagaaaggga 
ggcaaguacu 
aggcuaacug 
cgaagcucgu 
aacucaucgu 
cucuggcaag 
ccuacggggu 
uuggugagga 
gaucaauucg 
ugacugggaa 
cagcuggcgxL 



aguuuuaaac 
uuuaaucguu 
uucaauuuaa. 
aacaagcucu 
aucuaccgca 
cagagaugcc 
agcaagcaaa 
gagggccccc 
gagccaguuu 
cagcacggac 
ugcaagaucc 
uacuacuagg 
uaugcaauaa 
ucuaaauaau 
uuuaauuaaa 
aaaauaucuu 
ugguggucug 
uagcugacug 
cccuggcagc 
ugcagcacug 
cgagggaagg 
cucuuaggug 
ugcuggcguc 
ggaagcagag 
cccuauagug 
aacccuggcg 
aauagcgaag 



ucuaaauaau 
uuuaauuaaa 
aaaauaucuu 
uccucgucug 
ccguugucga 
agaaggaguu 
ugaggcaagg 
agcagggaua 
gcguuugccc 
cauuccaauc 
agcaaguugg 
guacucgagg 
uuugauuugg 
cuaaaucguu 
aaauauauau 
gcacgcagaa 
gaagggacau 
.guaaauuuuc 
uuguuucaag 
cuggacruagc 
accaccacca 
uugugauugc 
aucuucuiicg 
ggcgagaguu 
agucguauua 
uuacccaacu 
aggcccgcac 
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cuaaaucguu 
aaauauauau 
gcacgcagaa 
cgcaacucuc 
auucgaagaa 
ucagcaauca 
acgugguggu 
ccagcuacuc 
caccuugaaa 
caggaaaauu 
ugaauguccc 
uaagcucaac 
caagauaaac 
uucaauuggu 
auauauauau 
cgcugucgac 
ucaccaacuu 
cuggauugga 
guggggcaaa 
ugguaucccu 
cguccuugcc 
ugaaacuccu 
aauucgacaa 
gcgcagacga 
caauucacug 
uaaucgccuu 
cgau 



uucaauuggu 

auauauauau 

cgcuagggcc 

gcccucugcu 

gaugacgcca 

caacaccuaa 

gguccuuccc 

cagcagugcu 

caagcugcca 

uaccagucag 

uuccagacca 

aaaucuuuag 

uaauagauuu. 

uuaaauauau 

aucuugcauu 

uacccuagua 

gcuggaucuu 

augguccgug 

cgcaaacugg 

gcugggggcc 

ucauuugcuu 

ucuggcaucu 

cggugcggua 

ggaagagcuu 

gccgucguuu 

gcagcacauc 



uuaaauauau 
aucuugcauu 
gcggccgcgg 
uccuccucac 
gcaaccccgu 
gagcuugcca 
ucgacgauga 
gcaacgagcu 
gggcaguuag 
cuaaguacuu 
ccaucccuuu 
aaaauuaauu 
ugcgauuugg 
aucuugcauu 
uuuaaucguu 
guaaggaggg 
gcaaauguua 
cugucccugg 
cucuuccugg 
cucgaaaucg 
gcucauccau 
cugucuugga 
gauggaagcg 
guuagccaug 
uacaacgucg 
ccccuuucgc 



3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4954 
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multiple storage proteins 



<400> 85 

agcttggtac 

gcggccgcgg 

tttgttgttc 

atggagtcac 

atgcaccaga 

gctcaatggt 

gccagcaacc 

ccacaagggc 

ggcttcgcac 

ctccagaacc 

attaggccac 

ttagaggaga 

gacgtgtaca 

ctcagacttc 

aagggcgaat 

aactcacgtt 

agacgttcat 

tccgtgacat 

ctggtgtagc 

cggatctcgc 



cgagctcgga 
atcctcaggg 
acggaagggg 
cggtatttgg 
aagtagagca 
tctacaacaa 
agaaccagct 
aggaatggct 
ctgagatctt 
agcaagataa 
ccttgagacg 
ctttgtgcac 
agccatcact 
tccgccttag 
tctgcagatc 
tgttgttcac 
ggagtcaccg 
gcaccagaaa 
tcaatggttc 
cagcaaccag 



tccactagta 
tcttttcttg 
tctaatggga 
agaaggtcaa 
cctacggtgc 
tggaaatgag 
tgaccgcaac 
acaaggccga 
ggctcaagcc 
ccgtggcaac 
cggcgaaggc 
catgcgatgc 
cggatacatt 
cgctcttcgt 
cttcagggtc 
ggaaggggtc 
gtatttggag 
gtagagcacc 
tacaacaatg 
aaccagcttg 



acggccgcca 
cccactttct 
agagttattc 
ggtcagggtc 
ggtgacacca 
cctctcattc 
cttagaccat 
aagcaacaga 
ttcaagatca 
atcgtcaagg 
ggccaacaac 
actgaaaacc 
agcacactta 
ggctccatcc 
ttttcttgcc 
taatgggaag 
aaggtcaagg 
tacggtgcgg 
gaaatgagcc 
accgcaacct 



gtgtgctgga 
tgaacgccgg 
cgggatgcgc 
agagtcaagg 
ttgcaacacc 
ttgttgcagc 
ttttgatagc 
agcaaaacaa 
atgtcgagac 
tcaacggacc 
cacatgaaat 
tcgatgaccc 
acagctacaa 
gtaaaaggat 
cactttcttg 
agttattccg 
tcagggtcag 
tgacaccatt 
tctcattctt 
tagaccattt 



attcgccctt 
caaactcacg 
cgagacgttc 
gttccgtgac 
atctggtgta 
cgcggatctc 
cggaaacaac 
catcttcaat 
ggctcagcag 
tttcggcgtc 
agctaatggt 
gtcggatgct 
tcttcctatc 
ccgcggccgc 
aacgccggca 
ggatgcgccg 
agtcaagggt 
gcaacaccat 
gttgcagccg 
ttgatagccg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 
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gaaacaaccc acaagggcag gaatggctac 
tcttcaatgg cttcgcacct gagatcttgg 
ctcagcagct ccagaaccag caagataacc 
tcggcgtcat taggccaccc ttgagacgcg 
ctaatggttt agaggagact .ttgtgcacca 
cggatgctga cgtgtacaag ccatcactcg 
ttcctatcct cagacttctc cgccttagcg 
atggctaaca agctcttcct cgtctgcgca 
gcttccatct accgcaccgt tgtcgaattc 
ccaagacaga gatgccagaa ggagtttcag 
tggatgagca agcaaatgag gcaaggacgt 
gatttcgagg gcccccagca gggataccag 
caggaagagc cagtttgcgt ttgccccacc 
cagggacagc acggaccatt ccaatccagg 
aacatttgca agatccagca agttggtgaa 
cctccttact actagggtag atatccatca 
aatctttaga aaattaattt tatgtgacat 
aatagatttt gcgatttgga gttttaaact 
taaatatata tcttgcattt ttaatcgttt 
tcttgcattt ttaatcgttt tcaatttaaa 
ccctagtagt aaggagggaa gaaagggatg 
tggatcttgc aaatgttagg caagtactta 
ggtccgtgct gtccctggag gctaactgcc 
caaactggct cttcctggcg aagctcgttg 
tgggggccct cgaaatcgaa ctcatcgtcg 
atttgcttgc tcatccatct ctggcaagct 
tggcatctct gtcttggacc tacggggttg 
gtgcggtaga tggaagcgtt ggtgaggagg 
aagagcttgt tagccatagg atcttttacg 
aagtctgagg ataggaagat tgtagctgtt 
gtacacgtca gcatccgacg ggtcatcgag 
ctcctctaaa ccattagcta tttcatgtgg 
tggcctaatg acgccgaaag gtccgttgac 
gttctggagc tgctgagccg tctcgacatt 
tgcgaagcca ttgaagatgt tgttttgctt 
cccttgtggg ttgtttccgg ctatcaaaaa 
gttgctggcg agatccgcgg ctgcaacaag 
ccattgagct acaccagatg gtgttgcaat 
ctggtgcatg tcacggaacc cttgactctg 
tgactccatg aacgtctcgg cgcatcccgg 
aacaacaaac gtgagtttgc cggcgttcaa 
ctgcagaatt cgcccttgcg gccgcggatc 
aggcggagaa gtctgaggat aggaagattg 
gatggcttgt acacgtcagc atccgacggg 
cacaaagtct cctctaaacc attagctatt 
ctcaagggtg gcctaatgac gccgaaaggt 
tcttgctggt tctggagctg ctgagccgtc 
atctcaggtg cgaagccatt gaagatgttg 
cattcctgcc cttgtgggtt gtttccggct 
tggttctggt tgctggcgag atccgcggct 
ttgtagaacc attgagctac accagatggt 
tctactttct ggtgcatgtc acggaaccct 
aataccggtg actccatgaa cgtctcggcg 
cttccgtgaa caacaaacgt gagtttgccg 
tgactcgagc atgcat 

<210> 86 
<211> 4456 
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aaggccgaaa gcaacagaag caaaacaaca 1260 
ctcaagcctt caagatcaat gtcgagacgg 1320 
gtggcaacat cgtcaaggtc aacggacctt 13 80- 
gcgaaggcgg ccaacaacca catgaaatag . 1440 
tgcgatgcac tgaaaacctc gatgacccgt 1500 
gatacattag cacacttaac agctacaatc 1560 
ctcttcgtgg ctccatccgt aaaagatcct 1620 
actctcgccc tctgcttcct cctcaccaac 1680 
gaagaagatg acgccagcaa ccccgtaggt 1740 
caatcacaac acctaagagc ttgccagaga 1800 
ggtggtggtc cttccctcga cgatgagttc 1860 
ctactccagc agtgctgcaa cgagcttcgc 1920 
ttgaaacaag ctgccagggc agttagcctc 1980 
aaaatttacc agtcagctaa gtacttgcct 2 040 
tgtcccttcc agaccaccat ccctttcttc 2100 
cactggcggc cgctcgacgt aagctcaaca 2160 
atgcaataat ttgatttggc aagataaact 2220 
ctaaataatc taaatcgttt tcaattggtt 2280 
ttaattaaaa aatatatata tatatatata 2340 
aaatatcttg cacgcagaac gcctcgacta 2400 
gtggtctgga agggacattc accaacttgc 2460 
gctgactggt aaattttcct ggattggaat 2520 
ctggcagctt gtttcaaggt ggggcaaacg 2580 
cagcactgct ggagtagctg gtatccctgc 2 640 
agggaaggac caccaccacg tccttgcctc 27 00 
cttaggtgtt gtgattgctg aaactccttc 2760 
ctggcgtcat cttcttcgaa ttcgacaacg 2820 
aagcagaggg cgagagttgc gcagacgagg 2 880 
gatggagcca cgaagagcgc taaggcggag 2940 
aagtgtgcta atgtatccga gtgatggctt 3000 
gttttcagtg catcgcatgg tgcacaaagt 30 60 
ttgttggccg ccttcgccgc gtctcaaggg 3120 
cttgacgatg ttgccacggt tatcttgctg 3180 
gatcttgaag gcttgagcca agatctcagg 3240 
ctgttgcttt cggccttgta gccattcctg 33 00 
tggtctaagg ttgcggtcaa gctggttctg 3 3 60 
aatgagaggc tcatttccat tgttgtagaa 3420 
ggtgtcaccg caccgtaggt gctctacttt 3480 
accctgacct tgaccttctc caaataccgg 3 540 
aataactctt cccattagac cccttccgtg 3 600 
gaaagtgggc aagaaaagac cctgaaggat 3 660 
cttttacgga tggagccacg aagagcgcta 372 0 
tagctgttaa gtgtgctaat gtatccgagt 3780 
tcatcgaggt tttcagtgca tcgcatggtg 3 840 
tcatgtggtt gttggccgcc ttcgccgcgt 3 900 
ccgttgacct tgacgatgtt gccacggtta 3960 
tcgacattga tcttgaaggc ttgagccaag 4020 
ttttgcttct gttgctttcg gccttgtagc 4080 
atcaaaaatg gtctaaggtt gcggtcaagc 4140 
gcaacaagaa tgagaggctc atttccattg 4200 
gttgcaatgg tgtcaccgca ccgtaggtgc 4260 
tgactctgac cctgaccttg accttctcca 4320 
catcccggaa taactcttcc cattagaccc 43 80 
gcgttcaaga aagtgggcaa gaaaagaccc 4440 

4456 
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<212> KKTA 

<213> Kiinstliche Secjuenz 
<220> 

<223> Beschreibung der kOnstlichen Sequenz: RNA coding 
for dsKNA for suppression of multiple storage 
proteins 

<400> 86 

agcuugguac cgagcucgga uccacuagua acggccgcca gugugcugga auucgcccuu 60 
gcggccgcgg auccucaggg ucuuuucuug cccacuuucu ugaacgccgg caaacucacg 120 
uuuguuguuc acggaagggg ucuaauggga agaguuauuc cgggaugcgc cgagacguuc 180 
auggagucac cgguauuugg agaaggucaa ggucaggguc agagucaagg guuccgugac 240 
augcaccaga aaguagagca ccuacggugc ggugacacca uugcaacacc aucuggugua 3 00 
gcucaauggu ucuacaacaa uggaaaugag ccucucauuc uucfuugcagc cgcggaucuc 3 60 
gccagcaacc agaaccagcu ugaccgcaac cuuagaccau uuuugauagc cggaaacaac 420 
ccacaagggc aggaauggcu acaaggccga aagcaacaga agcaaaacaa caucuucaau 480 
ggcuucgcac cugagaucuu ggcucaagcc uucaagauca augucgagac ggcucagcag 540 
cuccagaacc agcaagauaa ccguggcaac aucgucaagg ucaacggacc uuucggcguc 600 
auuaggccac ccuugagacg cggcgaaggc ggccaacaac cacaugaaau agcuaauggu 660 
uuagaggaga cuuugugcac caugcgaugc acugaaaacc ucgaugaccc gucggaugcu 720 
gacguguaca agccaucacu cggauacauu .agcacacuua acagcuacaa ucuuccuauc 780 
cucagacuuc uccgccuuag cgcucuucgu ggcuccaucc guaaaaggau ccgcggccgc 840 
aagggcgaau ucugcagauc cuucaggguc uuuucuugcc cacuuucuug aacgccggca 900 
aacucacguu uguuguucac ggaagggguc uaaugggaag aguuauuccg ggaugcgccg 960 
agacguucau ggagucaccg guauuuggag aaggucaagg ucagggucag agucaagggu 1020 
uccgugacau gcaccagaaa guagagcacc uacggugcgg ugacaccauu gcaacaccau 1080 
cugguguagc ucaaugguuc uacaacaaug gaaaugagcc ucucauucuu guugcagccg 1140 
cggaucucgc cagcaaccag aaccagcuug accgcaaccu uagaccauuu uugauagccg 1200 
gaaacaaccc acaagggcag gaauggcuac aaggccgaaa gcaacagaag caaaacaaca 1260 
ucuucaaugg cuucgcaccu gagaucuugg cucaagccuu caagaucaau gucgagacgg 1320 
cucagcagcu ccagaaccag caagauaacc guggcaacau cgucaagguc aacggaccuu 1380 
ucggcgucau uaggccaccc uugagacgcg gcgaaggcgg ccaacaacca caugaaauag 1440 
cuaaugguuu agaggagacu uugugcacca ugcgaugcac ugaaaaccuc gaugacccgu 1500 
cggaugcuga cguguacaag ccaucacucg gauacauuag cacacuuaac agcuacaauc 1560 
uuccuauccu cagacuucuc cgccuuagcg cucuucgugg cuccauccgu aaaagauccu 1620 
auggcuaaca agcucuuccu cgucugcgca acucucgccc ucugcuuccu ccucaccaac 1680 
gcuuccaucu accgcaccgu ugucgaauuc gaagaagaug acgccagcaa ccccguaggu 1740 
ccaagacaga gaugccagaa ggaguuucag caaucacaac accnaagagc uugccagaga 1800 
uggaugagca agcaaaugag gcaaggacgu gguggugguc cuucccucga cgaugaguuc 1860 
gauuucgagg gcccccagca gggauaccag cuacuccagc agugcugcaa cgagcuucgc 1920 
caggaagagc caguuugcgu uugccccacc uugaaacaag cugccagggc aguuagccuc 1980 
cagggacagc acggaccauu ccaauccagg aaaauuuacc agucagcuaa guacuugccu 2040 
aacauuugca agauccagca aguuggugaa ugucccuucc agaccaccau cccuuucuuc 2100 
ccuccuuacu acuaggguag auauccauca cacuggcggc cgcucgacgu aagcucaaca 2160 
aaucuuuaga aaauuaauuu uaugugacau augcaauaau nugauuuggc aagauaaacu 2220 
aauagauuuu gcgauuugga guuuuaaacu cuaaauaauc uaaaucguuu ucaauugguu 2280 
uaaauauaua ucuugcauuu uuaaucguuu uuaauuaaaa aauauauaua uauauauaua 2340 
ucuugcaiiuu uuaaucguuu ucaauuuaaa aaauaucuug cacgcagaac gccucgacua 2400 
cccuaguagu aaggagggaa gaaagggaug guggucugga agggacauuc accaacuugc 2460 
uggaucuugc aaauguuagg caacruacuua gcugacuggu aaauuuuccu ggauuggaau 2520 
gguccgugcu gucccuggag gcuaacugcc cuggcagcuu guuucaaggu ggggcaaacg 2580 
caaacuggcu cuuccuggcg aagcucguug cagcacugcu ggaguagcug guaucccugc 2640 
ugggggcccu cgaaaucgaa cucaucgucg agggaaggac caccaccacg uccuugccuc 2700 
auuugcuugc ucauccaucu cuggcaagcu cuuagguguu gugauugcug aaacuccuuc 27 60 
uggcaucucu gucuuggacc uacgggguug cuggcgucau cuucuucgaa uucgacaacg 2820 
gugcgguaga uggaagcguu ggugaggagg aagcagaggg cgagaguugc gcagacgagg 2880 
aagagcuugu uagccauagg aucuuuuacg gauggagcca cgaagagcgc uaaggcggag 2940 
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aagucugagg auaggaagau uguagcuguu aagugugcua auguauccga gugauggcuu 3 000 
guacacguca gcauccgacg ggucaucgag guuuucagug caucgcaugg ugcacaaagu 3060 
cuccucuaaa ccauuagcua uuucaugugg uuguuggccg ccuucgccgc gucucaaggg 3120 
uggccuaaug acgccgaaag guccguugac cuugacgaug uugccacggu uaucuugcug 3180 
guucuggagc ugcugagccg ucucgacauu gaucuugaag gcuugagcca agaucucagg 3240 
ugcgaagcca uugaagaugu xiguuuugcuu cuguugcuuu cggccuugua gccauuccug 3300 
cccuuguggg -uuguuuccgg cuaucaaaaa uggucuaagg .uugcggucaa gcugguucug 33 60 
guugcuggcg agauccgcgg cugcaacaag aaugagaggc ucauuuccau uguuguagaa 3420 
ccauugagcu acaccagaug guguugcaau ggugucaccg caccguaggu gcucuacuuu 3480 
cuggugcaug ucacggaacc cuugacucug acccugaccu ugaccuucuc caaauaccgg 3540 
ugacuccaug aacgucucgg cgcaucccgg aauaacucuu cccauuagac cccuuccgug 3600 
aacaacaaac gugaguuugc cggcguucaa gaaagugggc aagaaaagac ccugaaggau 3 660 
cugcagaauu cgcccuugcg gccgcggauc cuuuuacgga uggagccacg aagagcgcua. 3 720 
aggcggagaa gucugaggau aggaagauug uagcuguuaa gugugcuaau guauccgagu 3780 
gauggcuugu acacgucagc auccgacggg ucaucgaggu uuucagugca ucgcauggug 3 840 
cacaaagucu ccucuaaacc aimagcuauu ucaugugguu gauggccgcc uucgccgcgu 3900 
cucaagggug gccuaaugac gccgaaaggu ccguugaccu ugacgauguu gccacgguua- 3960 
ucuugcuggu ucuggagcug cugagccguc ucgacauuga ucuugaaggc uugagccaag. 4020 
aucucaggug cgaagccauu gaagauguoig uuuugcuucu guugcuxiucg gccuuguagc 4080 
cauuccugcc cuuguggguu guuuccggcu aucaaaaaug gucuaaggiiu gcggacaagc. 4140' 
ugguucugga ugcuggcgag auccgcggcu gcaacaagaa ugagaggcuc auiiuccauiag 4200 
uuguagaacc auugagcuac accagauggu guugcaaugg ugucaccgca ccguaggugc 4260 
ucuac-auucu ggugcauguc acggaacccu ugacucugac ccugaccuug accuucucca 4320 
aauaccggug acuccaugaa cgucucggcg caucccggaa uaacucuucc cauuagaccc 4380 
cuuccgugaa caacaaacgu gaguuugccg gcguucaaga aagugggcaa gaaaagaccc 4440 
ugacucgagc augcau 4456 

<210> 87 
<211> 33 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibiing der kiiast lichen Seqfuenz: 
oligonucleotide primer 

<400> 87 

aaaaggcctg tgttccattt ggccggaaac aac 33 

<210> 88 
<211> 31 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiins t lichen Sequenz : 
oligonucleotide primer 

<400> 88 

aaagatatca ccctggagaa cgccacgagt: g 31 

<210> 89 
<211> 33 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Besclireibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 89 

aaaaggccta tggctaacaa gctcttcctc gtc 33 
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<210> 90 
<211> 32 
<212> DNA 

<213> Kiiixstliclie Sequenz 
<220> 

<223> Beschreibxmg der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 90 

aaagatatcc tagtagtaag gagggaagaa ag 32 

<210> 91 
<2il> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibimg der kunstlichen Secjuenz: 
oligonucleotide primer 

<400> 91 

ccgctcgagc tcagggtctt ttcttgccca ct 32 

<210> 92 
<211> 32 
<212> DNA 

<213> Kunstliclie Sequenz 

<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 92 

ccggtcgacc tagtagtaag gagggaagaa ag 32 

<210> 93 
<211> 1500 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1497) 

<223> globuline-like protein 

<400> 93 

atg act aga ttt gcg gta ttg cca etc tct gtt ctt ctt etc gtt etc 48 

Met Thr Arg Phe Ala Val Deu Pro Leu Ser Val Leu Leu Leu Val Leu 
1 5 10 15 • 

ttg ttc etc tgc act gag teg ttg get aag teg gag gag tct gaa gaa 96 
Leu Phe Leu Cys Thr Glu Ser Leu Ala Lys Ser Glu Glu Ser Glu Glu 
20 25 30 

tac gae gtc get gtg cet tea tgt tgc ggg ttt teg tct cet ctt ctg 144 
Tyr Asp Val Ala Val Pro Ser Cys Cys Gly Phe Ser Ser Pro Leu Leu 
35 40 45 

att aag aaa gat caa tgg aaa cca ate ttc gag aeg aag ttt gga cag 192 
lie Lys Lys Asp Gin Trp Lys Pro lie Phe Glu Thr Lys Phe Gly Gin 
50 55 60 

ate tea ace gtt caa ate ggc aat gga tgc ggt gga atg gga cet tac 240 
He Ser Thr Val Gin He Gly Asn Gly Cys Gly Gly Met Gly Pro Tyr 
65 70 75 80 
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aag ata cat tec ata acg ttg gag cca aac aca att ttg etc cct ctt 2 88 

Lys lie His Ser lie Thr Leu Glu Pro Asn Tlir lie Leu Leu Pro Leu 

85 90 95 

ctt ctt cat tec gac atg gtc ttc ttc gtt gac tct gga agt ggg att 336 
Leu Leu His Ser Asp Met Val Plie Phe Val Asp Ser Gly Ser Gly lie 
100 105 110 

ctg aat tgg gtt gac gag gaa gcg aag agt acc gag ate aga eta gga 384 
Leu Asn Trp Val Asp Glu Glu Ala Lys Ser Tlir Glu lie Arg Leu Gly 
115 120 125 

gac gtt tac agg eta cgt ccc ggt teg gtt ttc tac tta cag age aaa 432 
Asp Val Tyr Arg Leu Arg Pro Gly Ser Val Phe Tyr Leu Gin Ser Lys 

130 135 140 

ceg gat cct tgc ttt ggt gcc tat teg agt ate aca gat eta atg ttt 480 
Pro Asp Pro Cys Phe Gly Ala Tyr Ser Ser lie Thr Asp Leu Met Phe 
145 150 155 160 

ggt ttt gat gag aca att etc cag tea get ttt ggg gtt cct gag ggg 528 
Gly Phe Asp Glu Thr He Leu Gin Ser Ala Phe Gly Val Pro Glu Gly 
165 170 175 

att ata gag ctg atg agg aac cgt acg aag cca cca ttg ate gtg agt 576 
He He Glu Leu Met Arg Asn Arg Thr Lys Pro Pro Leu He Val Ser 
180 185 190 

gag acg ctt tgc aca cca ggt gtg gcc aac act tgg cag etc caa ceg 624 
Glu Thr Leu Cys Thr Pro Gly Val Ala Asn Thr Trp Gin Leu Gin Pro 
195 200 205 

cga tta eta aag etc ttt get gga agt gea gac ttg gtg gat aac aag 672 
Arg Leu Leu Lys Leu Phe Ala Gly Ser Ala Asp Leu Val Asp Asn Lys 
210 215 220 

aag aag aaa gag aag aaa gag aag aag gag aag gtg aag aaa gcg aag 720 
Lys Lys Lys Glu Lys Lys Glu Lys Lys Glu Lys Val Lys Lys Ala Lys 
225 230 235 240 

aca ttc aat gtt ttc gaa tct gaa ceg gat ttc gag age ccc tac ggt 768 
Thr Phe Asn Val Phe Glu Ser Glu Pro Asp Phe Glu Ser Pro Tyr Gly 
245 250 255 

cgt act ata acg att aac agg aag gat ctg aaa/gtt tta aaa ggc tea 816 
Arg Thr He Thr He Asn Arg Lys Asp- Leu Lys Val Leu Lys Gly Ser 
260 265 270 

atg gtt gga gtt tec atg gtg aat etc act caa gga teg atg atg gga 864 
Met Val Gly Val Ser Met Val Asn Leu Thr Gin Gly Ser Met Met Gly 
275 280 285 

ceg cac tgg aat cca tgg get tgc gag att teg att gta ttg aaa gga 912 
Pro His Trp Asn Pro Trp Ala Cys Glu He Ser He Val Leu Lys Gly 
290 295 300 

gea gga atg gtt agg gtt ctt agg tct teg ata tea tea aac aca tea 960 
Ala Gly Met Val Arg Val Leu Arg Ser Ser He Ser Ser Asn Thr Ser 
305 310 315 320 

tea gag tgt aag aac gtg agg ttt aaa gta gag gaa gga gat att ttc 1008 
Ser Glu Cys Lys Asn Val Arg Phe Lys Val Glu Glu Gly Asp He Phe 

325 330 335 

gea gtt cca egg tta cat cca atg get caa atg tct ttc aac aat gac 1056 
Ala Val Pro Arg Leu His Pro Met Ala Gin Met Ser Phe Asn Asn Asp 
340 345 350 
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teg tta gtg ttc gtt ggg ttt act act tea get aag aat aac gag cog 1104 
Ser Leu Val Phe Val Gly Phe Thr Tlir Ser Ala Lys Asn Asn Glu Pro 
355 360 365 

cag ttc tta gcc ggg gag gac teg get ttg egg atg ctt gac egg eaa 1152 
Gin Phe Leu Ala Gly Glu Asp Ser Ala Leu Arg Met Leu Asp Arg Gin 

370 375 380 

gta ttg get gea teg ctt aat gtg agt agt gtg acg att gat gga ttg 1200 
Val Leu Ala Ala Ser Leu Asn Val Ser Ser Val Tlir lie Asp Gly Leu 
385 390 395 400 

ttg gga get cag aag gaa get gtt ate ttg gaa tgt eat tet tgt gcg 1248 
Leu Gly Ala Gin Lys Glu Ala Val lie Leu Glu Cys His Ser Cys Ala 
405 410 415 

gaa gga gag ata gag aag ctt aag gtg gag ata gag agg aag aaa ata 1296 
Glu Gly Glu lie Glu Lys Leu Lys Val Glu lie Glu Arg Lys Lys lie 
420 425 430 

gat gat gag agg aag agg aga cat gat gaa agg aag aaa gaa gaa gaa 1344 
Asp Asp Glu Arg Lys Arg Arg His Asp Glu Arg Lys Lys Glu Glu Glu 
435 440 445 

gag gcg aag aga gaa gag gaa gag agg agg aaa egt gaa gaa gaa gaa 1392 
Glu Ala Lys Arg Glu Glu Glu Glu Arg Arg Lys Arg Glu Glu Glu Glu 
450 455 460 

gag aag aag egg tgg eca cct caa eaa eca cca eaa gaa gaa gaa ctt 1440 
Glu Lys Lys Arg Trp Pro Pro Gin Gin Pro Pro Gin Glu Glu Glu Leu 
465 470 475 480 

agg gaa egg caa eta ceg atg gag aaa gaa tgg gaa atg gaa ggt gaa 1488 
Arg Glu Arg Gin Leu Pro Met Glu Lys Glu Trp Glu Met Glu Gly Glu 
485 490 495 

gag gag agt taa 1500 
Glu Glu Ser 

<210> 94 
<211> 499 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 94 

Met Thr Arg Phe Ala* Val Leu Pro Leu Ser Val Leu Leu Leu Val Leu 
15 10 15 

Leu Phe Leu Cys Thr Glu Ser Leu Ala Lys Ser Glu Glu Ser Glu Glu 
20 25 30 

Tyr Asp Val AIsl Val Pro Ser Cys Cys Gly Phe Ser Ser Pro Leu Leu 
35 40 45 

lie Lys Lys Asp Gin Trp Lys Pro lie Phe Glu Thr Lys Phe Gly Gin 
50 55 60 

lie Ser Thr Val Gin He Gly Asn Gly Cys Gly Gly Met Gly Pro Tyr 
65 70 75 80 

Lys He His Ser He Thr Leu Glu Pro Asn Thr He Leu Leu Pro Leu 

85 90 95 

Leu Leu His Ser Asp Met Val Phe Phe Val Asp Ser Gly Ser Gly He 
100 105 110 

Leu Asn Trp Val Asp Glu Glu Ala Lys Ser Thr Glu He Arg Leu Gly 
115 120 125 
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Asp Val Tyr Arg Leu Arg Pro Gly Ser Val Phe Tyr Leu Gin Ser Lys 
130 135 140 

Pro Asp Pro Cys Phe Gly Ala Tyr Ser Ser lie Thr Asp Leu Met Phe 
145 150 155 160 

Gly Phe Asp -Qlu Thr lie Leu Gin Ser Ala Phe Gly Val Pro Glu Gly 
165 170 175 

lie lie Glu Leu Met Arg Asn Arg Thr Lys Pro Pro Leu lie Val Ser 
180 185 190 

Glu Thr Leu Cys Thr Pro Gly Val Ala Asn Thr Trp Gin Leu Gin Pro 

195 200 205 

Arg Leu Leu Lys Leu Phe Ala Gly Ser Ala Asp Leu Val Asp Asn Lys 
210 215 220 

Lys Lys Lys Glu Lys Lys Glu Lys Lys Glu Lys Val Lys Lys Ala Lys 

225 230 235 240 

Thr Phe Asn Val Phe Glu Ser Glu Pro Asp Phe Glu Ser Pro Tyr Gly 
245 250 255 

Arg Thr lie Thr lie Asn Arg Lys Asp Leu Lys Val Leu Lys Gly Ser 
260 265 270 

Met Val Gly Val Ser Met Val Asn Leu Thr Gin Gly Ser Met Met Gly 
275 280 285 

Pro His Trp Asn Pro Trp Ala Cys Glu lie Ser lie Val Leu Lys Gly 

290 295 300 

Ala Gly Met Val Arg Val Leu Arg Ser Ser lie Ser Ser Asn Thr Ser 
305 310 315 320 

Ser Glu Cys Lys Asn Val Arg Phe Lys Val Glu Glu Gly Asp lie Phe 
325 330 335 

Ala Val Pro Arg Leu His Pro Met Ala Gin Met Ser Phe Asn Asn Asp 
340 345 350 

Ser Leu Val Phe Val Gly Phe Thr Thr Ser Ala Lys Asn Asn Glu Pro 
355 360 365 

Gin Phe Leu Ala Gly Glu Asp Ser Ala Leu Arg Met Leu Asp Arg Gin 
370 375 380 

Val Leu Ala Ala Ser Leu Asn Val Ser Ser Val Thr lie Asp Gly Leu 
385 390 395 400 

Leu Gly Ala Gin Lys Glu Ala Val lie Leu Glu Cys His Ser Cys Ala 

405 410 415 

Glu Gly Glu lie Glu Lys Leu Lys Val Glu lie Glu Arg Lys Lys lie 
420 425 430 

Asp Asp Glu Arg Lys Arg Arg His Asp Glu Arg Lys Lys Glu Glu Glu 

435 440 445 

Glu Ala Lys Arg Glu Glu Glu Glu Arg Arg Lys Arg Glu Glu Glu Glu 
450 455 460 

Glu Lys Lys Arg Trp Pro Pro Gin Gin Pro Pro Gin Glu Glu Glu Leu 

465 470 475 480 

Arg Glu Arg Gin Leu Pro Met Glu Lys Glu Trp Glu Met Glu Gly Glu 

485 490 495 

Glu Glu Ser 
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<210> 95 

<211> 1284 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (1) . . (1281) 

<223> 7S seed global ine 

<400> 95 

atg get tec ate etc cac tac ttt tta gee etc tet ctt tet tgc tot 48 

Met Ala Ser lie Leu His Tyr Phe Leu Ala Leu Ser Leu Ser Cys Ser 
1 5 10 15 . 

ttt ctt ttc ttc tta tec gac tea gtc acc cot aca aaa cca ata aac 96 
Ph.e Leu Phe Piie Leu Ser Asp Ser Val Thr Pro Thr Lys Pro lie Asn 
20 25 30 

ctt gtt gtt eta ccc gtt eaa aat gat ggt tec aca ggg etc cat teg 144 
Leu Val Val Leu Pro Val* Gin Asn Asp Gly Ser Thr Gly Leu His Ser 
35 40 45 ' . 

gee aac etc caa aaa aga acc cet eta atg eaa gta cca gtc etg gtg 192 
Ala Asn Leu Gin Lys Arg Thr Pro Leu Met Gin Val Pro Val Leu Val 
50 55 60 

gac etc aat gga aat cac ttg tgg gtt aac tgt gag cag cag tac tea 240 
Asp Leu Asn Gly Asn His Leu Trp Val Asn Cys Glu Gin Gin Tyr Ser 
65 70 75 80 

tec aaa aeg tac caa gea ccc ttc tgc cac tec acc caa tgc tet aga 288 
Ser Lys Thr Tyr Gin Ala Pro Phe Cys His Ser Thr Gin Cys Ser Arg 

85 90 95 

gee aac ace cac caa tgc etc agt tgc ccc gcg gea tea agg cca ggg 336 
Ala Asn Thr His Gin Cys Leu Ser Cys Pro Ala Ala Ser Arg Pro Gly 
100 105 110 

tgc cac aaa aac aeg tgt ggc etc atg tec act aat ccc ate acc caa 384 
Cys His Lys Asn Thr Cys Gly Leu Met Ser Thr Asn Pro lie Thr Gin 
115 120 125 

caa acc ggt tta ggt gaa eta gga gaa gac gtt ctt gea ate cac gee 432 
Gin Thr Gly Leu Gly Glu Leu Gly Glu Asp Val Leu Ala lie His Ala 
130 135 140 

aca caa ggg teg acc caa caa ctt ggc cca ttg gtc aca gtc cca caa 480 
Thr Gin Gly Ser Thr Gin Gin Leu Gly Pro Leu Val Thr Val Pro Gin 
145 150 155 160 

ttc etc ttt tet tgt gea cct tec ttc ctt gtt caa aag ggt ctt cet 528 
Phe Leu Phe Ser Cys Ala Pro Ser Phe Leu Val Gin Lys Gly Leu Pro 
165 170 175 

aga aac act caa ggt gtg get ggg tta ggc cat gea cca att tet ctt 57 6 
Arg Asn Thr Gin Gly Val Ala Gly Leu Gly His Ala Pro lie Ser Leu 
180 185 190 

cca aac caa etc get tee cac ttt ggc eta caa egc eaa ttc ace act 624 
Pro Asn Gin Leu Ala Ser His Phe Gly Leu Gin Arg Gin Phe Thr Thr 
195 200 205 

tgc ctt tet egc tac cet act tea aag ggt get ata ata ttc ggg gat 672 
Cys Leu Ser Arg Tyr Pro Thr Ser Lys Gly Ala lie lie Phe Gly Asp 
210 215 220 
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gca cct aac aac atg cga cag ttt caa aac caa gat att ttc cac gat 720 
Ala Pro Asn Asn Met Arg Gin Phe Gin Asn Gin Asp He Phe His Asp 
225 230 235 240 

ttg gcc ttc acc cca tta acc ate acc ctg cag gga gag tac aac gtg 768 
Leu Ala Phe Thx Pro Leu Thr He Tlir Leu Gin Gly Glu Tyr Asn Val 
245 250 255 

aga gtc aac tea ata aga ate aac cag cac agt gtg ttc cca ctg aac 816 
Arg Val Asn Ser He Arg He Asn Gin His Ser Val Ph.e Pro Leu Asn 
260 265 270 

aag ata tea tec acc ate gta ggg teg acc tct gga gga acc atg att 864 
Lys He Ser Ser Thr He Val Gly Ser Thr Ser Gly Gly Thr Met He 
275 280 285 

age ace tea act cct cac atg gtt etc cag caa tec gtg tac cag get 912 
Ser Thr Ser Thr Pro His Met Val Leu Gin Gin Ser Val Tyr Gin Ala 
290 295 300 

ttc act cag gtg ttt get cag cag eta cca aag caa gca cag gtg aaa 960 
Phe Thr Gin Val Phe Ala Gin Gin Leu Pro Lys Gin Ala Gin Val Lys 
305 310 315 320 

tct gtg gca cca ttt ggg tta tge ttc aac tec aac aag ate aat gca 1008 
Ser Val Ala Pro Phe Gly Leu Cys Phe Asn Ser Asn Lys He Asn Ala 
325 330 335 

tat cct age gtg gac ctt gtg atg gac aag ecc aat ggt cct gtt tgg 1056 
Tyr Pro Ser Val Asp Leu Val Met Asp Lys Pro Asn Gly Pro Val Trp 

340 345 350 

aga ate tct ggt gag gac ttg atg gtg cag gca caa cct ggg gtc acg 1104 
Arg He Ser Gly Glu Asp Leu Met Val Gin Ala Gin Pro Gly Val Thr 
355 360 365 

tgt ttg ggt gtt atg aat gga gga atg caa cct aga get gaa att acc 1152 
Cys Leu Gly Val Met Asn Gly Gly Met Gin Pro Arg Ala Glu He Thr 
370 375 380 

tta ggg gca cgt cag ttg gaa gag aac ctg gtg gtg ttc gat ctt gca 1200 
Leu Gly Ala Arg Gin Leu Glu Glu Asn Leu Val Val Phe Asp Leu Ala 
385 390 395 . 400 

agg tea agg gtt ggg ttt age ace tea tea ctg cac teg cat gga gtc 1248 
Arg Ser Arg Val Gly Phe Ser Thr Ser Ser Leu His Ser His Gly Val 

405 410 415 

aaa tgt. get gac etc ttc aac ttt gcc aat gca tga 1284 
Lys Cys Ala Asp Leu Phe Asn Phe Ala Asn Ala 
420 425 

<210> 96 

<211> 427 

<212> PRT 

<213> Glycine max 

<400> 96 

Met Ala Ser lie Leu His Tyr Phe Leu Ala Leu Ser Leu Ser Cys Ser 
15 10 15 

Phe Leu Phe Phe Leu Ser Asp Ser Val Thr Pro Thr Lys Pro He Asn 
20 25 30 

Leu Val Val Leu Pro Val Gin Asn Asp Gly Ser Thr Gly Leu His Ser 
35 40 45 
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Ala Asn Leu Gin Lys Arg Thr Pro Leu Met Gin Val Pro Val Leu Val 

50 55 60 

Asp Leu Asn Gly Asn His Leu Trp Val Asn Cys Glu Gin Gin Tyr Ser 
65 70 75 80 

Ser Lys Thr Tyr Gin Ala Pro Phe Cys His Ser Thr Gin Cys Ser Arg 

85 90 95 

Al^ Asn Thr His Gin Cys Leu Ser Cys Pro Ala Ala Ser Arg Pro Gly 
100 105 110 

Cys His Lys Asn Thr Cys Gly Leu Met Ser Thr Asn Pro He Thr Gin 

115 120 125 

Gin Thr Gly Leu Gly Glu Leu Gly Glu Asp Val Leu Ala He His Ala 
130 135 140 

Thr Gin Gly Ser Thr Gin Gin Leu Gly Pro Leu Val Thr Val Pro Gin 
145 150 155 160 

Phe Leu Phe Ser Cys Ala Pro Ser Phe Leu Val Gin Lys Gly Leu Pro 
165 170 175 

Arg Asn Thr Gin Gly Val Ala Gly Leu Gly His Ala Pro He Ser Leu ' 
180 185 190 

Pro Asn Gin Leu Ala Ser His Phe Gly Leu Gin Arg Gin Phe Thr Thr 

195 200 205 

Cys Leu Ser Arg Tyr Pro Thr Ser Lys Gly Ala He He Phe Gly Asp 
210 215 220 

Ala Pro Asn Asn Met Arg Gin Phe Gin Asn Gin Asp He Phe His Asp 

225 230 235 240 

Leu Ala Phe Thr Pro Leu Thr He Thr Leu Gin Gly Glu Tyr Asn Val 
245 250 255 

Arg Val Asn Ser He Arg He Asn Gin His Ser Val Phe Pro Leu Asn 
260 265 270 

Lys He Ser Ser Thr He Val Gly Ser Thr Ser Gly Gly Thr Met He 
275 280 285 

Ser Thr Ser Thr Pro His Met Val Leu Gin Gin Ser Val Tyr Gin Ala 
290 295 300 

Phe Thr Gin Val Phe Ala Gin Gin Leu Pro Lys Gin Ala Gin Val Lys 
305 310 315 320 

Ser Val Ala Pro Phe Gly Leu Cys Phe Asn Ser Asn Lys He Asn Ala 
325 330 335 

Tyr Pro Ser Val Asp Leu Val Met Asp Lys Pro Asn Gly Pro Val Trp 
340 345 350 

Arg He Ser Gly Glu Asp Leu Met Val Gin Ala Gin Pro Gly Val Thr 
355 360 365 

Cys Leu Gly Val Met Asn Gly Gly Met Gin Pro Arg Ala Glu He Thr 

370 375 380 

Leu Gly Ala Arg Gin Leu Glu Glu Asn Leu Val Val Phe Asp Leu Ala 
385 . 390 - 395 400 

Arg Ser Arg Val Gly Phe Ser Thr Ser Ser Leu His Ser His Gly Val 

405 410 415 

Lys Cys Ala Asp Leu Phe Asn Phe Ala Asn Ala 
420 425 
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<210> 97 
<211> 814 
<212> DNA 
<213> Zea mays 

<220> 
<221> CDS 
<222> (1) . . (720) 
<223> 19kd zein 

<400> 97 

atg gca gcc aag att ttt gcc etc ctt gcc etc ctt get ctt tea gca 48 

Met Ala Ala Lys lie Phe Ala Leu Leu Ala Leu Leu Ala Leu Ser Ala 

15 10 15 

aac gtt get acc geg act att att oca caa tgc tea caa caa tac etc 96 
Asn Val Ala Thr Ala Thr lie lie Pro Gin Cys Ser Gin Gin Tyr Leu 
20 25 . 30 

tet ccg gtg aca gee geg aga ttt gaa tac eca act ata caa tec tac 144 
Ser Pro Val Thr Ala Ala Arg Plie Glu Tyr Pro Thr lie Gin Ser Tyr 
35 40 45 

agg eta caa cag gee ate gea gea age ate tta egg teg tta gca ttg 192 
Arg Leu Gin Gin Ala lie Ala Ala Ser lie Leu Arg Ser Leu Ala Leu 
50 55 60 

act gte caa caa cea tat gee eta ttg caa caa eca tec tta gtg aat 240 
Thr Val Gin Gin Pro Tyr Ala Leu Leu Gin Gin Pro Ser Leu Val Asn 
65 70 75 80 

eta tat etc caa aga ate gta gca caa caa eta caa caa caa ttg ctt 288 
Leu Tyr Leu Gin Arg lie Val Ala Gin Gin Leu Gin Gin Gin Leu Leu 

85 90 95 

eca aca ate aat gaa gta gtt gea geg aac ctt gat get tac etc eag 336 
Pro Thr He Asn Glu Val Val Ala Ala Asn Leu Asp Ala Tyr Leu Gin 
100 105 110 

caa caa caa ttt ctt eca tte aat caa eta get ggg gtg aac ect get 3 84 
Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Gly Val Asn Pro Ala 
115 120 125 

get tac ttg eag gea caa cag eta eta eca ttc aac caa ctt gte agg 432 
Ala Tyr Leu Gin Ala Gin Gin Leu Leu Pro Phe Asn Gin Leu Val Arg 
130 135 140 

age cet get gcc ttc tta ctg cag caa cag ttg ttg cea ttc eat eta 480 
Ser Pro Ala Ala Phe Leu Leu Gin Gin Gin Leu Leu Pro Phe His Leu 
145 150 155 160 

caa gtt gtg gca aac att get get ttc ttg caa caa caa caa ttg ctg 528 
Gin Val Val Ala Asn He Ala Ala Phe Leu Gin Gin Gin Gin Leu Leu 

165 170 175 

cea ttt tac eca cag gtt gtg gga aac att aac gee tte ttg caa cag 576 
Pro Phe Tyr Pro Gin Val Val Gly Asn He Asn Ala Phe Leu Gin Gin 
180 185 190 

caa cag ttg ctg cea tte tac cea cag gat gtg gca aac aat gte gcc 624 
Gin Gin Leu Leu Pro Phe Tyr Pro Gin Asp Val Ala Asn Asn Val Ala ■ 
195 200 205 

tte tta caa caa caa caa ttg ctg cea ttt age caa ctt get ttg acg 672 
Phe Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala Leu Thr 
210 215 220 
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aat cct acc acc tta ttg cag cag ccc acc att ggt ggt gcc ate ttc 720 
Asn Pro Thr Thr Leu Leu Gin Gin Pro Thr lie Gly Gly Ala He Phe 
225 230 235 240 

tagatttttt atgctttata ctgtaataat aaagttctca tactgatatg tgcaacttct 780 

cagtaataaa agattagaga tctatatttt atta 814 

<210> 98 
<211> 240 
<212> PRT 
<213> Zea mays 

<400> 98 

Met Ala Ala Lys He Plxe Ala Leu Leu Ala Leu Leu Ala Leu Ser Ala 
15 10 15 

Asn Val Ala Thr Ala Thr He He Pro Gin Cys Ser Gin Gin Tyr Leu 

20 25 30 

Ser Pro Val Thr Ala Ala Arg Phe Glu Tyr Pro Thr He Gin Ser Tyr 
35 40 45 

Arg Leu Gin* Gin Ala He Ala Ala Ser He Leu Arg Ser Leu Ala Leu 
50 55 60 

Thr Val Gin Gin Pro Tyr Ala Leu Leu Gin Gin Pro Ser Leu Val Asn 
65 70 75 80 

Leu Tyr Leu Gin Arg He Val Ala Gin Gin Leu Gin Gin Gin Leu Leu 

.85 90 95 

Pro Thr He Asn Glu Val Val Ala Ala Asn Leu Asp Ala Tyr Leu Gin 
100 105 110 

Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Gly Val Asn Pro Ala 
115 120 125 

Ala Tyr Leu Gin Ala Gin. Gin Leu Leu Pro Phe Asn Gin Leu Val Arg 
130 135 140 

Ser Pro Ala Ala Phe Leu Leu Gin Gin Gin Leu Leu Pro Phe His Leu 
145 150 155 160 

Gin Val Val Ala Asn He Ala Ala Phe Leu Gin Gin Gin Gin Leu Leu 
165 170 175 

Pro Phe Tyr Pro Gin Val Val Gly Asn He Asn Ala Phe Leu Gin Gin 
180 185 190 

Gin Gin Leu Leu Pro Phe Ty^^ Pro Gin Asp Val Ala Asn Asn Val Ala 

195 200 205 

Phe Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala Leu Thr 
210 215 220 

Asn Pro Thr Thr Leu Leu Gin Gin Pro Thr He Gly Gly Ala He Phe 
225 230 235 240 



<210> 99 
<211> 705 

<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (702) 

<223> 19 kd zein Bl 
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<400> 99 

atg gca gcc aaa ata ttt tgc etc ctt atg etc ctt ggt ctt tct gca 48 

Met Ala Ala Lys lie Phe Cys Leu Leu Met Leu Leu Gly Leu Ser Ala 

15 10 15 

agt get get acg gcg acc att ttc cca caa tgc tea caa get cet ata 96 
Ser Ala Ala Thr Ala Thr lie Phe Pro Gin Cys Ser Gin Ala Pro He 
20 " 25 30 

get tee ctt ett ccc ccg tac etc tea cca gcg gtg tct teg gta tgt 144 
Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Val Ser Ser Val Cys 
35 40 45 

gaa aac cca att ett caa ccc tat agg ate caa cag gca ate gca get 192 
. Glu Asn Pro He Leu Gin Pro Tyr Arg He Gin Gin Ala He Ala Ala 

50 55 60 

ggc ate tta cct tta tea ccc ttg ttc etc caa caa tea tea gee eta 240 
Gly He Leu Pro Leu Ser Pro Leu Ptie Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

tta cag cag tta cct ttg gtg cat tta ttg gca caa aac ate agg gca 288 
Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn He Arg Ala 

85 90 95 

caa caa eta caa caa ctt gtg eta gca aac ctt get gee tac tct cag 336 
Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
100 105 110 

caa caa cag ttt ctt eca ttc aac caa eta get gca ttg aac tct get 384 

Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn Ser Ala 

115 120 125 

tct tat ttg caa caa caa caa eta cca ttc age cag eta tct get gcc 432 

Ser Tyr Leu Gin Gin Gin Gin Leu Pro Phe Ser Gin Leu Ser Ala Ala 

130 135 140 

tac ccc cag caa ttt ctt cca ttc aac caa ctg aca get ttg aac tct 480 

Tyr Pro Gin Gin Phe Leu Pro Phe Asn Gin Leu Thr Ala Leu Asn Ser 
145 150 155 160 

cct get tat tta cag cag caa caa eta eta cca ttc age cag eta get 528 

Pro Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala 
165 170 175 

ggt gtg age cct get acc ttc ttg aca caa cca caa ttg ttg ccg ttc 576 
Gly Val Ser Pro Ala Thr Phe Leu Thr Gin Pro Gin Leu Leu Pro Phe 

180 185 190 

tac cag cae get gcg cct aac get ggc acc etc tta caa ctg caa caa 624 
Tyr Gin His Ala Ala Pro Asn Ala Gly Thr Leu Leu Gin Leu Gin Gin 
195 200 205 

ttg ctg cca ttc aac caa ctt get ttg aca aac cca aca gca ttc tac 672 
Leu Leu Pro Phe Asn Gin Leu Ala Leu Thr Asn Pro Thr Ala Phe Tyr 

210 215 220 

caa caa ccc ate att ggt ggt gcc etc ttt tag 705 
Gin Gin Pro He He Gly Gly Ala Leu Phe 
225 230 

<210> 100 
<211> 234 
<212> PRT 
<213> Zea mays 

<400> 100 

Met Ala 2^a Lys He Phe Cys Leu Leu Met Leu Leu Gly Leu Ser Ala 
15 10 15 
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Ser Ala Ala Thr Ala Tlir lie Phe Pro Gin Cys Ser Gin Ala Pro lie 
20 25 30 

Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Val Ser Ser Val Cys 
35 40 45 

Glu Asn Pro lie Leu Gin Pro Tyr Arg lie Gin Gin Ala lie Ala Ala 
50 55 60 

Gly lie Leu Pro Leu Ser Pro Leu Plie Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 

85 90 95 

Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
100 105 110 

Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn Ser Ala 
115 120 125 

Ser Tyr Leu Gin Gin Gin Gin Leu Pro Phe Ser Gin Leu Ser Ala Ala 
. 130 135 140 

Tyr Pro Gin Gin Phe Leu Pro Phe Asn Gin Leu Thr Ala Leu Asn Ser 
145 150 155 160 

Pro Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala 
165 170 175 

Gly Val Ser Pro Ala Thr Phe Leu Thr Gin Pro Gin Leu Leu Pro Phe 

180 185 190 

Tyr Gin His Ala Ala Pro Asn Ala Gly Thr Leu Leu Gin Leu Gin Gin 
195 200 205 

Leu Leu Pro Phe Asn Gin Leu Ala Leu Thr Asn Pro Thr Ala Phe Tyr 
210 215 220 

Gin Gin Pro He He Gly Gly Ala Leu Phe 
225 230 



<210> 101 
<211> 804 
<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (801) 

<223> 19 kd zein B2 

<400> 101 

atg gca gcc aaa ata ttt tgc etc att atg etc ett ggt ctt tct gca 48 

Met Ala Ala Lys He Phe Cys Leu He Met Leu Leu Gly Leu Ser Ala 
15 10 15 

agt get get acg gcg age att ttc ceg caa tgc tea caa get cet ata 96 
Ser Ala Ala Thr Ala Ser He Phe Pro Gin Cys Ser Gin Ala Pro He 
20 25 30 

get tec ctt ctt cec eca tac etc tea cca gcg atg tct tea gta tgt 144 
Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Met Ser Ser Val Cys 
35 40 45 

gaa aat cca att ctt eta ccc tac agg ate caa cag gca ate gca gca 192 
Glu Asn Pro He Leu Leu Pro Tyr Arg He Gin Gin Ala He Ala Ala 
50 55 60 
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ggc ate tta cct tta tea ccc ttg ttc etc caa caa tea tea gee eta 240 

Gly lie Leu Pro Leu Ser Pro Leu Phe Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

tta cag cag tta cct ttg gtg cat tta ttg gca caa aac ate agg gca 288 
Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 

85 90 95 

caa caa eta caa caa etc gtg eta gea aac ett get gee tae tct cag 336 
Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
100 105 110 

caa cag cag tta cct ttg gtg cat ttg ttg gca caa aac ate agg gca 3 84 
Gin Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 
115 120 ' 125 

caa caa eta caa caa etc gtg eta gca aac ett get gee tae tct cag 432 
Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
130 135 140 

caa caa cag ttt etg cea ttc aac caa eta get gca ttg aac tct get 480 
Gin Gin Gin Plie Leu Pro Ph.e Asn Gin Leu Ala Ala Leu Asn Ser Ala 
145 150 155 160 

get tat ttg cag caa caa caa eta eta cea ttc age cag eta get get 528 
Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Ph.e Ser Gin Leu Ala Ala 

165 170 175 

gee tae ccc egg caa ttt ett cea ttc aac caa etg gea gea ttg aac 576 
Ala Tyr Pro Arg Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn 

180 185 190 

tct cat get tat gta caa caa caa caa eta eta cea ttc age cag eta 624 
Ser His Ala Tyr Val Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu 
195 200 205 

get get gtg age cct get gee ttc ttg aca cag caa eat ttg ttg ccg 672 
Ala Ala Val Ser Pro Ala Ala Phe Leu Thr Gin Gin His Leu Leu Pro 
210 215 220 

ttc tae etg cac act gcg cct aac gtt ggc ace etc tta caa etg caa 720 
Phe Tyr Leu His Thr Ala Pro Asn Val Gly Thr Leu Leu Gin Leu Gin 
225 230 235 240 

caa ttg etg cea ttc gae caa ett get ttg aca aac cea gca gtg ttc 768 
Gin Leu Leu Pro Phe Asp Gin Leu Ala Leu Thr Asn Pro Ala Val Phe 

245 250 255 

tae caa caa ccc ate att ggt ggt gee etc ttt tag 804 
Tyr Gin Gin Pro lie lie Gly Gly Ala Leu Phe 
260 265 

<210> 102 
<211> 267 
<212> PRT 
<213> Zea mays 

<400> 102 

Met Ala Ala Lys lie Phe Cys Leu lie Met Leu Leu Gly Leu Ser Ala 

1-5 10 15 

Ser Ala Ala Thr Ala Ser lie Phe Pro Gin Cys Ser Gin Ala Pro lie 
20 25 30 

Ala Ser Leu Leu Pro Pro Tyr Leu Ser Pro Ala Met Ser Ser Val Cys 
35 40 45 
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Glu Asn Pro lie Leu Leu Pro Tyr Arg lie Gin Gin Ala lie Ala Ala 
50 55 60 

Gly lie Leu Pro Leu Ser Pro Leu Plie Leu Gin Gin Ser Ser Ala Leu 
65 70 75 80 

Leu Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 

85 90 95 

Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
100 105 110 

Gin Gin Gin Leu Pro Leu Val His Leu Leu Ala Gin Asn lie Arg Ala 

115 120 125 

Gin Gin Leu Gin Gin Leu Val Leu Ala Asn Leu Ala Ala Tyr Ser Gin 
130 135 140 

Gin Gin Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn Ser Ala 
145 150 155 160 

Ala Tyr Leu Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu Ala Ala 
165 170 175 

Ala Tyr Pro Arg Gin Phe Leu Pro Phe Asn Gin Leu Ala Ala Leu Asn 
180 185 190 

Ser His Ala Tyr Val Gin Gin Gin Gin Leu Leu Pro Phe Ser Gin Leu 
195 200 205 

Ala Ala Val Ser Pro Ala Ala Phe Leu Thr Gin Gin His Leu Leu Pro 

210 215 220 

Phe Tyr Leu His Thr Ala Pro Asn Val Gly Thr Leu Leu Gin Leu Gin 
225 230 235 240 

Gin Leu Leu Pro Phe Asp Gin Leu Ala Leu Thr Asn Pro Ala Val Phe 
245 250 255 

Tyr Gin Gin Pro lie He Gly Gly Ala Leu Phe 
260 265 

<210> 103 
<211> 801 
<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (798) 

<223> 22kd alpha-zein 

<400> 103 

atg get acc aag ata tta gee etc ctt gcg etc ctt tec ett tea gtg 48 
Met Ala Thr Lys He Leu Ala Leu Leu Ala Leu Leu Ser Leu Ser Val 
15 10 15 

age gca aca act gca ttc att att cea caa tgc tea ctt get cet aat 96 
Ser Ala Thr Thr Ala Phe He He Pro Gin Cys Ser Leu Ala Pro Asn 
20 25 30 

g-cc att att cca cag ttc etc cca tea gtt aca tea atg gge ate gaa 144 
Ala He He Pro Gin Phe Leu Pro Ser Val Thr Ser Met Gly He Glu 
35 40 45 

cac cct att gtg caa gcc tat agg eta caa caa gcg ett gcg gcg age 192 
His Pro He Val Gin Ala Tyr Arg Leu Gin Gin Ala Leu Ala Ala Ser 
50 55 60 
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gtc tta caa caa ccg ttt gcc caa tta caa caa caa tec ttg gca cat 240 
Val Leu Gin Gin Pro Phe Ala Gin Leu Gin Gin Gin Ser Leu Ala His 
65 70 75 80 

eta acc ata caa acc ate gca aea caa eta gag caa cag ttt gtg cee 288 
Leu Tlir He Gin ^Kir He Ala Thr Gin Leu Glu Gin Gin Plie Val Pro 

85 90 95 

gca ttg age caa eta gcc gcg gtg aac eet gtc tec tac ttg caa cag 336 
Ala Leu Ser Gin Leu Ala Ala Val Asn Pro Val Ser Tyr Leu Gin Gin 
100 105 110 

caa atg ett gca tee aac eea ett get etg geg aac aea gee gca tac 384 
Gin Met Leu Ala Ser Asn Pro Leu Ala Leu Ala Asn Thr Ala Ala Tyr 
115 120 • 125 

cag caa caa eta cag ttg caa cag ttt eta cca get ett agt caa eta 432 
Gin Gin Gin Leu Gin Leu Gin Gin Phe Leu Pro Ala Leu Ser Gin Leu 
130 135 140 

gee agg gtg aac eet gee aca tac etg caa cag caa caa ctg ett tea 480 
Ala Arg Val Asn Pro Ala Thr Tyr Leu Gin Gin Gin Gin Leu Leu Ser 
145 150 155 160 

tct age cca etc get gtg gge aat geg get aea tac etg caa cag cag 52 8 
Ser Ser Pro Leu Ala Val Gly Asn Ala Ala Thr Tyr Leu Gin Gin Gin 
165 170 175 

ctg eta caa cag ate gta ccg get ett agt cag eta gtt gtg gcg aac 576 
Leu Leu Gin Gin He Val Pro Ala Leu Ser Gin Leu Val Val Ala Asn 
180 185 190 

cct act gcc tac tta caa cag ett ett cca tte aac caa eta gat gtg 624 
Pro Thr Ala Tyr Leu Gin Gin Leu Leu Pro Phe Asn Gin Leu Asp Val 
195 200 205 

gca aac tct get gcg tac eta caa cag egg cag caa eta ett aat cca 672 
Ala Asn Ser Ala Ala Tyr Leu Gin Gin Arg Gin Gin Leu Leu Asn Pro 
210 215 220 

ett gca geg get aac cca ttg gtc gee gee tte etg caa cag caa caa 720 
Leu Ala Ala Ala Asn Pro Leu Val Ala Ala Phe Leu Gin Gin Gin Gin 
225 230 235 240 

ttt ctg cca tac aac caa ate tct ttg atg aac ett gcc ttg tea agg 768 
Phe Leu Pro Tyr Asn Gin He Ser Leu Met Asn Leu- Ala Leu Ser Arg 
245 25.0 255 

cag caa ccg ate gtt gga ggt gee ate ttt tag 801 
Gin Gin Pro He Val Gly Gly Ala He Phe 
260 265 

<210> 104 
<211> 266 
<212> PRT 
<213> Zea mays 

<400> 104 

Met Ala Thr Lys He Leu Ala Leu Leu Ala Leu Leu Ser Leu Ser Val 
15 10 15 

Ser Ala Thr Thr Ala Phe He He Pro Gin Cys Ser Leu Ala Pro Asn 
20 25 30 

Ala He He Pro Gin Phe Leu Pro Ser Val Thr Ser Met Gly He Glu 
35 40 .45 
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His Pro He Val Gin Ala Tyr Arg Leu Gin Gin Ala I*eu Ala Ala Ser 
50 55 60 

Val Leu Gin Gin Pro Phe Ala Gin Leu Gin Gin Gin Ser Leu Ala His 
65 70 75 80 

Leu Thr He Gin Tlir He Ala Thr Gin Leu Glu Gin Gin Phe Val Pro 

85 90 95 

Ala Leu Ser Gin Leu Ala Ala Val Asn Pro Val Ser Tyr Leu Gin Gin 
100 105 110 

Gin Met Leu Ala Ser Asn Pro Leu Ala Leu Ala Asn Thr Ala Ala Tyr 

115 120 125 

Gin Gin Gin Leu Gin Leu Gin Gin Phe Leu Pro Ala Leu Ser Gin Leu 
130 135 140 

Ala. Arg Val Asn Pro Ala Thr Tyr Leu Gin Gin Gin Gin Leu Leu Ser 
145 150 155 160 

Ser Ser Pro Leu Ala Val Gly Asn Ala Ala Thr Tyr Leu Gin Gin Gin 
165 170 175 

Leu Leu Gin Gin He Val Pro Ala Leu Ser Gin Leu Val Val Ala Asn 
180 185 190 

Pro Thr Ala Tyr Leu Gin Gin Leu Leu Pro Phe Asn Gin Leu Asp Val 
195 200 205 

Ala Asn Ser Ala Ala Tyr Leu Gin Gin Arg Gin Gin Leu Leu Asn Pro 
210 215 220 

Leu Ala Ala Ala Asn Pro Leu Val Ala Ala Phe Leu Gin Gin Gin Gin 
225 230 235 240 

Phe Leu Pro Tyr Asn Gin He Ser Leu Met Asn Leu Ala Leu Ser Arg 
245 250 255 

Gin Gin Pro He Val Gly Gly Ala He Phe 
260 265 



<210> 105 
<211> 471 
<212> DNA 
<213> Oryza sativa 

<220> 
<221> CDS 
<222> (1) . . (468) 
<223> prolamin 

<400> 105 

atg aag ate att ttc gta ttt get etc ctt get att gtt gca tgc aac 48 

Met Lys He He Phe Val Phe Ala Leu Leu Ala He Val Ala Cys Asn 
15 10 15 

get tct gca egg ttt gat get ctt agt eaa agt tat aga caa tat caa 96 
Ala Ser Ala Arg Phe Asp Ala Leu Ser Gin Ser Tyr Arg Gin Tyr Gin 
20 25 30 

eta caa teg eat etc ctg eta cag caa eaa gtg etc age eca tgc agt 144 
Leu Gin Ser His Leu Leu Leu Gin Gin Gin Val Leu Ser Pro Cys Ser 
35 40 45 

gag ttc gta agg caa cag cat age ata gtg gca ace ccc ttc tgg caa 192' 
Glu Phe Val Arg Gin Gin His Ser He Val Ala Thr Pro Phe Trp Gin 
50 55 60 
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cca get acg ttt caa ttg ata aac aac caa gtc atg cag caa cag tgt 240 

Pro Ala Thr Phe Gin Leu lie Asn Asn Gin Val Met Gin Gin Gin Cys 
65 70 75 80 

tgc caa cag etc agg ctg gta gcg caa caa tct cac tac cag gcc att 288 
Cys Gin Gin Leu Arg Leu Val Ala Gin Gin Ser His Tyr Gin Ala lie 

85 90 95 

agt age gtt cag gcg att gtg cag caa eta cag ctg cag cag gtc ggt 336 
Ser Ser Val Gin Ala He Val Gin Gin Leu Gin Leu Gin Gin Val Gly 
100 105 110 

gtt gtc tac ttt gat cag act caa get caa get caa get ttg ctg gee 384 
Val Val Tyr Phe Asp Gin Thr Gin Ala Gin Ala Gin Ala Leu Leu Ala 
115 120 125 

tta aac ttg cca tec ata tgt ggt ate tat cet aac tac tac att get 432 
Leu Asn Leu Pro Ser He Cys Gly He Tyr Pro Asn Tyr Tyr He Ala 
130 135 140 

ccg agg age att ccc ace gtt ggt ggt gtc tgg tac tga 471 
Pro Arg Ser He Pro Thr Val Gly Gly Val Tip Tyr 
145 . 150 155 

<210> 106 
<211> 156 
<212> PRT 

<213> Oryza sativa 
<400> 106 

Met Lys He He Phe Val Phe Ala Leu Leu Ala He Val Ala Cys Asn 
15 10 15 

Ala Ser Ala Arg Phe Asp Ala Leu Ser Gin Ser Tyr Arg Gin Tyr Gin 

20 25 30 

Leu Gin Ser His Leu Leu Leu Gin Gin Gin Val Leu Ser Pro Cys Ser 
35 40 45 

Glu Phe Val Arg Gin Gin His Ser He Val Ala Thr Pro Phe Trp Gin 
50 55 60 

Pro Ala Thr Phe Gin Leu He Asn Asn Gin Val Met Gin Gin Gin Cys 
65 70 75 80 

Cys Gin Gin Leu Arg Leu Val Ala Gin Gin Ser His Tyr Gin Ala He 

85 90 95 

Ser Ser Val Gin Ala He Val Gin Gin Leu Gin Leu Gin Gin Val Gly 
100 105 110 

Val Val Tyr Phe Asp Gin Thr Gin Ala Gin Ala Gin Ala Leu Leu Ala 
115 120 125 

Leu Asn Leu Pro Ser He Cys Gly He Tyr Pro Asn Tyr Tyr He Ala 
130 135 140 

Pro Arg Ser He Pro Thr Val Gly Gly Val Trp Tyr 
145 150 155 



<210> 107 
<211> 645 
<212> DNA 

<213> Avena sativa 

<220> 
<221> CDS 
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<222> (1) , . (642) 
<223> avenin 



<400> 107 

atg aag ate ttc ttc ttc tta get etc ctt get etg gta gtg age gee 48 

Met Lys lie Ph.e Phe Phe Leu Ala Leu Leu Ala Leu Val Val Ser Ala 

1 5 10 15 . . 

ace ttt gca caa tat gca gaa tct gac ggt agt tat gag gaa gtg gag 96 
Thr Phe Ala Gin Tyr Ala Glu Ser Asp Gly Ser Tyr Glu Glu Val Glu 
20 25 ' 30 

ggt tct eat gat ega tge caa caa cat cag atg aag ctg gac tct tgc 144 
Gly Ser His Asp Arg Cys Gin Gin His Gin Met Lys Leu Asp Ser Cys 
35 40 45 

aga gag tac gtg geg gag egg tgc aca acg atg aga gat ttt ceg ate 192 
Arg Glu Tyr Val Ala Glu Arg Cys Thx Thr Met Arg Asp Phe Pro lie 
50 * 55 60 

acc tgg cca tgg aaa tgg tgg aag ggt ggt tgc gag gag etc cgc aat 240 
Thr Trp Pro Trp Lys Trp Trp Lys Gly Gly Cys Glu Glu Leu Arg Ash 
65 70 75 80 

gag tgc tgc caa ctg ttg ggc cag atg cca teg gag tgt cgc tgt gat 2 88 
Glu Cys Cys Gin Leu Leu Gly Gin Met Pro Ser Glu Cys Arg Cys Asp 

85 90 95 

geg att tgg aga tea ate cag cgc gag ctt ggt ggc ttc ttt gga act 336 
Ala lie Trp Arg Ser lie Gin Arg Glu Leu Gly Gly Phe Phe Gly Thr 
100 105 110 

caa caa ggt ctg ata ggg aaa agg ttg aag ata gcc aag agt ttg ecc 384 
Gin Gin Gly Leu lie Gly Lys Arg Leu Lys lie Ala Lys Ser Leu Pro 
115 120 125 

acg cag tea aca tgg gcc ctg agt gca ata tec cca aac tec atg gtt 432 
Thr Gin Ser Thr Trp Ala Leu Ser Ala lie Ser Pro Asn Ser Met Val 
130 135 140 

age cac att get gga aag age tec att ctt cgt gcc ttg ecc gtg gat 480 
Ser His lie Ala Gly Lys Ser Ser lie Leu Arg Ala Leu Pro Val Asp 
145 150 155 160 

gtc etc gcc aat gca tac cgc att tec agg caa gaa gcc ega aac etc 528 
Val Leu Ala Asn Ala Tyr Arg lie Ser Arg Gin Glu Ala Arg Ash Leu 
165 170 175 

aaa aac aac agg gga caa gag tct ggt gta ttc act cca aaa ttt acc 576 
Lys Asn Asn Arg Gly Gin Glu Ser Gly Val Phe Thr Pro Lys Phe Thr 
180 185 190 

caa acg age ttc caa ect tat cca gag ggc gag gat gag tea tct ttg 624 
Gin Thr Ser Phe Gin Pro Tyr Pro Glu Gly Glu Asp Glu Ser Ser Leu 
195 200 205 

att aat aag gca tea gag taa 645 
lie Asn Lys Ala Ser Glu 
210 

<210> 108 
<211> 214 
,<212> PRT 
<213> Avena sativa 

<400> 108 

Met Lys lie Phe Phe ' Phe Leu Ala Leu Leu Ala Leu Val Val Ser Ala 
15 10 15 
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Thr Pile Ala Gin Tyr Ala Glu Ser Asp Gly Ser Tyr Glu Glu Val Glu 

20 25 30 

Gly Ser His Asp Arg Cys Gin Gin His Gin Met Lys Leu Asp Ser Cys 
35 40 45 

Arg Glu Tyr Val Ala Glu Arg Cys Thr Thx Met Arg Asp Phe Pro lie 
50 55 60 - 

Tlir Trp Pro Trp Lys Trp Trp Lys Gly Gly Cys Glu Glu Leu Arg Asn 
65 70 75 80 

Glu Cys Cys Gin Leu Leu Gly Gin Met Pro Ser Glu Cys Arg Cys Asp 

85 90 95 

Ala lie T3:p Arg Ser lie Gin Arg Glu Leu Gly Gly Phe Phe Gly Thr 
100 105 110 

Gin Gin Gly Leu lie Gly Lys Arg Leu Lys lie Ala Lys Ser Leu Pro 
115 120 125 

Thr Gin Ser Thr Trp Ala Leu Ser Ala lie Ser Pro Asn Ser Met Val 
130 135 140 

Ser His lie Ala Gly Lys Ser Ser lie Leu Arg Ala Leu Pro Val Asp 
145 150 155 160 

Val Leu Ala Asn Ala Tyr Arg lie Ser Arg Gin Glu Ala Arg Asn Leu 

165 170 175 

Lys Asn Asn Arg Gly Gin Glu Ser Gly Val Phe Thr Pro Lys Phe Thr 
180 185 190 

Gin Thr Ser Phe Gin Pro Tyr Pro Glu Gly Glu Asp Glu Ser Ser Leu 
195 200 205 

lie Asn Lys Ala Ser Glu 
210 



<210> 109 
<211> 1044 
<212> DNA 

<213> Hordeuiti vulgar e 

<220> 
<221> CDS 
<222> (1)..(1041) 
<223> c-hordein 

<220> 

<221> misc^f eature 
<222> (481) . . (482) 

<223> /transl_except= (pos:481. .483 ,aa: OTHER) 
<400> 109 

atg aag acg ttc etc acc ttt gtc etc ctt gcc atg gcg atg age ate 48 
Met Lys Thr Phe Leu Thr Phe Val Leu Leu Ala Met Ala Met Ser lie 
1.5 10 15 

gtc aet ace get agg eag eta aac cct age eac eaa gag ttg caa tea 96 
Val Thr Thr Ala Arg Gin Leu Asn Pro Ser His Gin Glu Leu Gin Ser 
20 25 30 

cca caa caa cca ttt ctg aaa caa caa tea tat ctg caa caa cca tat 144 
Pro Gin Gin Pro Phe Leu Lys Gin Gin Ser Tyr Leu Gin Gin Pro Tyr 
35 40 45 
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cca caa caa cca tat eta ccg cag caa cca ttc ccc aca ccc caa caa 192 
Pro Gin Gin Pro Tyr Leu Pro Gin Gin Pro Plie Pro Thr Pro . Gin Gin 
50 55 60 

ttt ttc ccc tat eta cca cag caa aca ttt ccc cca tec caa caa cca 240 
Ptie Pile Pro Tyr Leu Pro Gin Gin Thr Phe Pro Pro Ser Gin Gin Pro 
65 70 75 . 80 

aac ccc eta caa cca caa caa cca ttc ccc ctg caa ccc caa cca cca 2 88 
Asn Pro Leu Gin Pro Gin Gin Pro Phe Pro Leu Gin Pro Gin Pro Pro 

85 90 95 

caa caa cct ttt cct cag ccc caa caa cca aat ccc cag caa cca caa 336 
Gin Gin Pro Phe Pro Gin Pro Gin Gin Pro Asn Pro Gin Gin Pro Gin 
100 105 110 

caa cct ttc ccc egg caa cca caa caa ata gta ccc cag caa cca caa 384 
Gin Pro Phe Pro Arg Gin Pro Gin Gin lie Val Pro Gin Gin Pro Gin 
115 120 125 

caa cca ttc cct cag caa cca caa caa cct ttt cct cag ccc caa caa 432 
Gin Pro Phe Pro Gin Gin Pro Gin Gin Pro Phe Pro Gin Pro Gin Gin 
130 135 140 

cca ttc tct tgg caa cca caa caa cca ttt etc cag ccc eta caa eta 480 
Pro Phe Ser Trp Gin Pro Gin Gin Pro Phe Leu Gin Pro Leu Gin Leu 

145 150 155 160 

tag ccc ctg caa gca caa caa cca ttc ccc ttg caa cct caa eta cca 528 
Pro Leu Gin Ala Gin Gin Pro Phe Pro Leu Gin Pro Gin Leu Pro 
165 170 175 

ttt ccg caa ccc caa caa cca att gga cag caa cca aaa caa cca etc 576 
Phe Pro Gin Pro Gin Gin Pro lie Gly Gin Gin Pro Lys Gin Pro Leu 
180 185 190 

ctg cag caa cca caa caa aca att ccc cag caa cca caa caa cca ttc 624 
Leu Gin Gin Pro Gin Gin Thr lie Pro Gin Gin Pro Gin Gin Pro Phe 
195 200 . 205 

ccc ctg cag ccg caa caa cca ttc ccc caa caa cca caa caa cca ctt 672 
Pro Leu Gin Pro Gin Gin Pro Phe Pro Gin Gin Pro Gin Gin Pro Leu 
210 215 220 

ccc caa caa ccc caa caa ata att tec cag caa- ccc caa caa cca ttc -720 
Pro Gin Gin Pro Gin Gin lie He Ser Gin Gin Pro Gin Gin Pro Phe 
225 230 235 240 

cct eta caa cct caa caa cca ttc ccc caa ccc caa cca ttc ccc cag 768 
Pro Leu Gin Pro Gin Gin Pro Phe Pro Gin Pro Gin Pro Phe Pro Gin 

245 250 255 

gag caa ccc caa caa gca ttc ccc eta caa ccg caa caa cca ttc ccc 816 
Glu Gin Pro Gin Gin Ala Phe Pro Leu Gin Pro Gin Gin Pro Phe Pro 
260 265 270 

gag gaa tea gaa caa ata att ace caa caa cca ttc cct eta caa cca 864 
Glu Glu Ser Glu Gin He He Thr Gin Gin Pro Phe Pro Leu Gin Pro 
275 280 285 

caa caa ctg ttc ccc cag caa cca caa caa cca ctt ccc cag ccc caa 912 
Gin Gin Leu Phe Pro Gin Gin Pro Gin Gin Pro Leu Pro Gin Pro Gin 
290 295 300 

caa cca ttc cgc caa eta cca aaa tat ata att ccc cag caa cct caa 960 
Gin Pro Phe Arg Gin Leu Pro Lys Tyr He He Pro Gin Gin Pro Gin 
305 310 315 320 
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* caa cca ttc ctt ctg caa cca cac caa cct cag caa cct tat gca caa 1008 

Gin Pro Phe Leu Leu Gin Pro His Gin Pro Gin Gin Pro Tyr Ala Gin 
325 330 335 

caa gac ate tgg agt gat ata gcc etc ttg ggc taa 1044 
Gin Asp lie Trp Ser Asp lie Ala Leu Leu Gly 
340 345 

<210> 110 
<211> 160 
<212> PRT 

<213> Hordeum vulgare 
<400> 110 

Met Lys Thr Phe Leu Thr Phe Val Leu Leu Ala- Met Ala Met Ser lie 

15 10 15 

Val Thr Tlir Ala Arg Gin Leu Asn Pro Ser His Gin Glu Leu Gin Ser 

20 25 30 

Pro Gin Gin Pro Ph.e Leu Lys Gin Gin Ser Tyr Leu Gin Gin Pro Tyr 

35 40 45 

Pro Gin Gin Pro Tyr Leu Pro Gin Gin Pro Phe Pro Thr Pro Gin Gin 

50 55 60 

Phe Phe Pro* Tyr" Leu Pro Gin Gin Thr Phe Pro Pro Ser Gin Gin Pro 
65 70 75' • 80 

Asn Pro Leu Gin Pro Gin Gin Pro Phe Pro Leu Gin Pro Gin Pro Pro 

85 90 95 

Gin Gin Pro Phe Pro Gin Pro Gin Gin Pro Asn Pro Gin Gin Pro Gin 

100 105 110 

Gin Pro Phe Pro Arg Gin Pro Gin Gin lie Val Pro Gin Gin Pro Gin 

115 120 125 

Gin Pro Phe Pro Gin Gin Pro Gin Gin Pro Phe Pro Gin Pro Gin Gin 

130 135 140 

Pro Phe Ser Trp Gin Pro Gin Gin Pro Phe Leu Gin Pro Leu Gin Leu 
145 150 155 160 

<210> 111 
<211> 186 
<212> PRT 

<213> Hordeum vxilgare 
<400> 111 

Pro Leu Gin Ala Gin Gin Pro Phe Pro Leu Gin Pro Gin Leu Pro Phe 

- 1 5 10 15 

Pro Gin Pro Gin Gin Pro lie Gly Gin Gin Pro Lys Gin Pro Leu Leu 

20 25 30 

Gin Gin Pro Gin Gin Thr lie Pro Gin Gin Pro Gin Gin Pro Phe Pro 

35 40 45 

Leu Gin Pro Gin Gin Pro Phe Pro Gin Gin Pro Gin Gin Pro Leu Pro 

50 55 60 

Gin Gin Pro Gin Gin lie He Ser Gin Gin Pro Gin Gin Pro Phe Pro 
65 70 75 80 

Leu Gin Pro Gin Gin Pro Phe Pro Gin Pro Gin Pro Phe Pro Gin Glu 

85 90 .95 

Gin Pro Gin Gin Ala Phe Pro Leu Gin Pro Gin Gin Pro Phe Pro Glu 

100 105 110 

Glu Ser Glu Gin He He Thr Gin Gin Pro Phe Pro Leu Gin Pro Gin 

115 120 125 

Gin Leu Phe Pro Gin Gin Pro Gin Gin Pro Leu Pro Gin Pro Gin Gin 

130 135 140 

Pro Phe Arg Gin Leu Pro Lys Tyr He He Pro Gin Gin Pro Gin Gin 
. 145 150 155 160 
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Pro Phe Leu Leu Gin Pro His Gin Pro Gin Gin Pro Tyr Ala Gin Gin 

165 170 175 

Asp lie Trp Ser Asp He Ala Leu Leu Gly 
. 180 185 

<210> 112 
<211> 924 
<212> DNA 

<213> Triticum aestivum 

<220> 
<221> CDS 
<222> (1) . . (921) 
<223> glutenin-lDl 

<400> 112 

atg aag acc ttc etc gtc ttt gcc etc etc gee gtt gcg gcg aca agt 

Met Lys Thr Phe Leu Val Phe Ala Leu Leu Ala Val Ala Ala Thr Ser 
l" 5 10 15 

gca att gcg cag atg gag act aga tgc ate ect ggt ttg gag aga cca 96 
Ala lie Ala Gin Met Glu Thr Arg Cys He Pro Gly Leu Glu Arg Pro 

20 25 30 

tgg cag cag caa cca tta cca cca caa cag aca ttt cca caa caa cca 144 
Trp Gin Gin Gin Pro Leu Pro Pro Gin Gin Thr Phe Pro Gin Gin Pro 

35 40 45 

eta ttt tea caa caa caa caa caa caa eta ttt cet caa caa cca tea 192 
Leu Phe Ser Gin Gin Gin Gin Gin Gin Leu Phe Pro Gin Gin Pro Ser 

50 55 60 

ttt teg cag caa caa cca cca ttt tgg cag caa caa cca cca ttt tct 240 
Phe Ser Gin Gin Gin Pro Pro Phe Trp Gin Gin Gin Pro Pro" Phe Ser 
65 70 75 80 

cag caa caa cca att eta cca cag caa cca cca ttt teg cag caa caa 288 
Gin Gin Gin Pro He Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin 

85 90 95 

caa eta gtt eta ccg caa caa cca cca ttt tea cag caa caa caa cca 33 6 
Gin Leu Val Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin Gin Pro 

•100 105 110 

gtt tta cet cca caa caa tea cet ttt cca caa caa caa caa caa cac 3 84 
Val Leu Pro Pro Gin Gin Ser Pro Phe Pro' Gin Gin Gin Gin Gin His 

115 120 125 

caa cag ctg gtg caa caa caa ate cet gtt gtt cag cca tec att ttg 432 
Gin Gin Leu Val Gin Gin Gin He Pro Val Val Gin Pro Ser He Leu 

130 135 140 

cag cag eta aae cca tgc aag gta ttc etc cag cag cag tgc age cet 480 
Gin Gin Leu Asn Pro Cys Lys Val Phe Leu Gin Gin Gin Cys Ser Pro 
145 150 155 160 

gtg gca atg cca caa egt ctt get agg teg caa atg ttg cag cag age 528 
Val Ala Met Pro Gin Arg Leu Ala Arg Ser Gin Met Leu Gin Gin Ser 
165 170 175 

agt tgc cat gtg atg caa caa caa tgt tgc cag cag ttg ccg caa ate 576 
Ser Cys His Val Met Gin Gin Gin Cys Cys Gin Gin Leu Pro Gin He 

180 185 190 

ccc cag caa tec cgc tat gag gca ate egt get ate ate tac tec ate 624 
Pro Gin Gin Ser Arg Tyr Glu Ala He Arg Ala He He Tyr Ser He 
195 200 205 
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ate ctg caa gaa caa caa cag gtt cag ggt tec ate caa tct eag cag 672 

lie Leu Gin Glu Gin Gin Gin Val Gin Gly Ser He Gin Ser Gin Gin 

210 215 220 

cag caa ccc caa cag ttg ggc caa tgt gtt tee caa ccc caa cag cag 720 
Gin Gin Pro Gin Gin Leu Gly Gin Cys Val Ser Gin Pro Gin Gin Gin 
225 230 235 240 

teg cag cag caa etc ggg caa caa cct caa caa caa caa ttg gea cag 768 
Ser Gin Gin Gin Leu Gly Gin Gin Pro Gin Gin Gin Gin Leu Ala Gin 

245 250 255 

ggt ace ttt ttg cag cca cac eag ata get cag ett gag gtg atg act 816 
Gly Thr Plie Leu Gin Pro His Gin He Ala Gin Leu Glu Val Met Thr 
260 .265 270 

tee att gcg etc egt ate ctg cca acg atg tgc agt gtt aat gtg ecg 864 
Ser He Ala Leu Arg He Leu Pro Thr Met Cys Ser Val Asn Val Pro 
275 280 285 

ttg tac aga ace acc act agt gtg cca tte ggc gtt ggc ace gga gtt 912 
Leu Tyr Arg Thr Tlir Thr Ser Val Pro Phe Gly Val Gly Thr Gly Val 
290 295 300 



ggt gee tac tga 
Gly Ala Tyr 
305 

<210> 113 
<211> 307 
<212> PRT 

<213> Triticum aestivum 
<400> 113 

Met Lys Thr Phe Leu Val Phe Ala Leu Leu Ala Val Ala Ala Thr Ser 
1 5 10 15 

Ala He Ala Gin Met Glu Thr Arg Cys He Pro Gly Leu Glu Arg Pro 
20 25 30 

Trp Gin Gin Gin Pro Leu Pro Pro Gin Gin Thr Phe Pro Gin Gin Pro 
35 40 45 

Leu Phe Ser Gin Gin Gin Gin Gin Gin Leu Phe Pro Gin Gin Pro Ser 
50 55 60 

Phe Ser Gin Gin Gin Pro Pro Phe Trp Gin Gin Gin Pro Pro Phe Ser 
65 70 75 80 

Gin Gin Gin Pro He Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin 

85 90 95 

Gin Leu Val Leu Pro Gin Gin Pro Pro Phe Ser Gin Gin Gin Gin Pro 
100 105 110 

Val Leu Pro Pro Gin Gin Ser Pro Phe Pro Gin Gin Gin Gin Gin His 

115 120 125 

Gin Gin Leu Val Gin Gin Gin He Pro Val Val Gin Pro Ser He Leu 

130 135 140 

Gin Gin Leu Asn Pro Cys Lys Val Phe Leu Gin Gin Gin Cys Ser Pro 
145 150 155 160 

Val Ala Met Pro Gin Arg Leu Ala Arg Ser Gin Met Leu Gin Gin Ser 

165 170 175 

Ser Cys His Val Met Gin Gin Gin Cys Cys Gin Gin Leu Pro Gin He 
180 185 190 



924 
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Pro 


Gin 


Gin 
195 


Ser 


Arg 


Tyr 


Glu 


Ala 
200 


He 


Arg Ala 


X JLt: 


205 


iyx 




He 


lie 


Leu 
210 


Gin 


Glu 


Gin 


Gin 


Gin 
215 


Val 


Gin Gly 


Ser 


220 


m n 




\3 JLXX 


Gin 


Gin 
225 


Gin 


Pro 


Gin 


Gin 


Leu 
230 


Gly Gin 


Cys 


vajL 


235 




±r X \J 


V9XXJ. 


wXUL 


V7XJLJ. 

240 


Ser 


Gin 


Gin 


Gin 


Leu 
245 


Gly 


Gin 


Gin 


Pro 


Gin 
250 


Gin 


brxn 


vaJLn 


Leu 


iTL.X a. 

255 


uXXl 


Gly 


Thr 


Phe 


Leu 
260 


Gin 


Pro 


His 


Gin 


He 
265 


Ala 


Gin 


Leu 


Glu 


Val 
270 


Met 


Thr 


Ser 


lie 


Ala 
275 


Leu 


Arg 


He 


Leu 


Pro 
280 


Thr 


Met 


Cys 


Ser 


Val 
285 


Asn 


Val 


Pro 


Leu 


Tyr 
290 


Arg 


Tlir 


Thr 


Tlir 


Ser 
295 


Val 


Pro 


Phe 


Gly Val 
300 


Gly Thr 


Gly 


Val 



Gly Ala Tyr 
305 



<210> 114 
<211> 8482 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kOnstlichen Sequenz: binary 
expression vector 

<400> 114 

ttccatggac atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccga 60 
ttattctaat aaacgctctt ttctcttagg tttacccgcc aatatatcct gtcaaacact 120 
gatagtttaa actgaaggcg ggaaacgaca atcagatcta gtaggaaaca gctatgacca 180 
tgattacgcc aatcaccact ttgtacaaga aagctgggtc tagatgacgg acaatcagta 240 
aattgaacgg agaatattat tcataaaaat acgatagtaa cgggtgatat attcattaga 3 00 
atgaaccgaa accggcggta aggatctgag ctacacatgc tcaggttttt tacaacgtgc 3 60 
acaacagaat tgaaagcaaa tatcatgcga tcataggcgt ctcgcatatc tcattaaagc 420 
aggaggcctt ctagactgca ggcggccgcc caccgcggtg ggctggctat gaagaaatta 480 
taatcgtgta aaacttagtg agtgtgtatg aatgaaagta ttgcaaaatc ctcattatat 540 
agactacatg cataactagt tgcatgtaaa tttgtagttt tcttcattat tgcatcctcc 600 
aagtggatgt catggtttta cacatggctt ccatgcaaat catttccaaa atatttttaa 660 
actttccaca gggcatccat gcatgcacct caaaacttgt gtgtggtaac attgttgtct 720 
•tgaaaaatta ctaaaccttt tgtccacgtg acgttcatgc acctcaaatc ttgtgtggta 780 
ccattattat cctcaagaat tattgaatgt ttggtgtata tgccatccat gcagcattgc 840 
aacaattaaa tctccaaacc ttgtggtacc atattcactc actttaattc tcctatagta 9 00 
gaaatattag caaatattta catttccagt tgattagtat atgtatttag aagacaaaaa 960 
taatttagaa tcaattaatc aacttgcaaa ttgctaagtg ttggcaaacg ttagcataaa 1020 
aggtgttata aatttagtac caaatataaa aatttatcgc aaatcaaata cataacacac 1080 
atagtaaaac aaaaacaaat tacaagggtt tagacgttta gtggcaatgt gtaaatttgc 1140 
tcgactgaat tggttccttt aagcctgctt ttttgtacaa acttgtgata attcactggc 1200 
cgtcgtttta caacgactca ggatcctgtc aaacactgat agtttaaact gaaggcggga 12 60 
aacgacaatc tgatcatgag cggagaatta agggagtcac gttatgaccc ccgccgatga 1320 
cgcgggacaa gccgttttac gtttggaact gacagaaccg caacgttgaa ggagccactc 1380 
agccgcgggt ttctggagtt taatgagcta agcacatacg tcagaaacca ttattgcgcg 1440 
ttcaaaagtc gcctaaggtc actatcagct agcaaatatt tcttgtcaaa aatgctccac 1500 
tgacgttcca taaattcccc tcggtatcca attagagtct catattcact ctcaatccaa 1560 
ataatctgca ccggatctgg atcgtttcgc atgattgaac aagatggatt gcacgcaggt 1620 
tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca gacaatcggc 1680 



BNSDOCID: <WO ^03078629A1J_> 



wo 03/078629 



PCT/EP03/02735 



117 



tgctctgatg 

accgacctgt 

gccacgacgg 

tggctgctat 

gagaaagtat 

tgcccattcg 

ggtcttgtcg 

ttcgccaggc 

gcctgcttgc 

cggctgggtg 

gagcttggcg 

tcgcagcgca 

tagatcttgc 

gatcgttcaa 

atgattatca 

atgacgttat 

gc ga t agaaa 

atgttactag 

tttatgcata 

tcagtacatt 

accacaatat 

atcaccacgc 

tgccgagttc 

ggcccgaggc 

ccgcgagctg 

gcatcgctcg 

caggcggcgc 

cgagaatgaa 

tttttcatta 

cccgcgcacg 

ctggcggcct 

tgatgtgtat 

gtaaataaac 

gcgggtcagg 

ccgatgttct 

gggaagatca 

aggccatcgg 

ctgtgtccgc 

acatatgggc 

gaaggctaca 

aggttgccga 

gcgtgagcta 

gcgacgctgc 

ttaatgaggt 

cgcacgcagc 

ggtcaacttt 

aggcaagacc 

caaatgaata 

aacaaccagg 

gcgtaagcgg 

aatcggcgtg 

tgacctggtg 

agcacgcccc 

accgccggca 

ttttttcgtt 

ggccgttttc 

tccagacggg 



ccgccgtgtt 
ccggtgccct 
gcgttccttg 
tgggcgaagt 
ccatcatggc 
accaccaagc 
atcaggatga 
tcaaggcgcg 
cgaatatcat 
tggcggaccg 
gcgaatgggc 
tcgccttcta 
tgcgttcgga 
acatttggca 
tataatttct 
t tat gaga tg 
acaaaatata 
atcgggcctc 
gatgcactcg 
aaagacgtcc 
atcctgccac 
gttaccacca 
gagcgttccc 
gtgaagtttg 
atcgaccagg 
accctgtacc 
ggtgccttcc 
cgccaagagg 
ccgaagagat 
tctcaaccgt 
ggccggccag 
ttgagtaaaa 
aaatacgcaa 
caagacgacc 
gttagtcgat 
accgctaacc 
ccggcgcgac 
gatcaaggca 
caccgccgac 
agcggccttt 
ggcgctggcc 
cccaggcact 
ccgcgaggtc 
aaagagaaaa 
agcaaggctg 
cagttgccgg 
attaccgagc 
aatgagtaga 
caccgacgcc 
ctgggttgtc 
agcggtcgca 
gagaagttga 
ggtgaatcgt 
gccggtgcgc 
ccgatgctct 
cgtctgtcga 
cacgtagagg 



ccggctgtca 
gaatgaactg 
cgcagctgt:g 
gccggggcag 
tgatgcaatg 
gaaacatcgc 
tctggacgaa 
catgcccgac 
ggtggaaaat 
ctatcaggac 
tgaccgcttc 
tcgccttctt 
tattttcgtg 
ataaagtttc 
gttgaattac 
ggtttttatg 
gcgcgcaaac 
ctgtcaagct 
aaatcagcca 
gcaatgtgtt 
cagccagcca 
cgccggccgg 
taatcatcga 
gcccccgccc 
aaggccgcac 
gcgcacttga 
gtgaggacgc 
aacaagcatg 
cgaggcggag 
gcggctgcat 
cttggccgct 
cagcttgcgt 
ggggaacgca 
atcgcaaccc 
tccgatcccc 
gttgtcggca 
ttcgtagtga 
gccgacttcg 
ctggtggagc 
gtcgtgtcgc 
gggtacgagc 
gccgccgccg 
caggcgctgg 
tgagcaaaag 
caacgttggc 
cggaggatca 
tgctatctga 
tgaattttag 
gtggaatgcc 
tgccggccct 
aaccatccgg 
aggccgcgca 
ggcaagcggc 
cgtcgattag 
atgacgtggg 
agcgtgaccg 
tttccgcagg 



gcgcaggggc 
caggacgagg 
ctcgacgttg 
gatctcctgt 
cggcggctgc 
atcgagcgag 
gagcatcagg 
ggcgaggatc 
ggccgctttt 
atagcgttgg 
ctcgtgcttt 
gacgagttct 
gagttcccgc 
ttaagattga 
gttaagcatg 
attagagtcc 
taggataaat 
ctgcttggta 
attttagaca 
attaagttgt 
acagctcccc 
ccgcatggtg 
ccgcacccgg 
taccctcacc 
cgtgaaagag 
gcgcagcgag 
attgaccgag 
aaaccgcacc 
atgatcgcgg 
gaaatcctgg 
gaagaaaccg 
catgcggtcg 
tgaaggttat 
atctagcccg 
agggcagtgc 
tcgaccgccc 
tcgacggagc 
tgctgattcc 
tggttaagca 
gggcgatcaa 
tgcccattct 
gcacaaccgt 
ccgctgaaat 
cacaaacacg 
cagcctggca 
caccaagctg 
atacatcgcg 
cggctaaagg 
ccatgtgtgg 
gcaatggcac 
cccggtacaa 
ggccgcccag 
cgctgatcga 
gaagccgccc 
cacccgcgat 
acgagctggc 
gccggccggc 



gcccggttct 
cagcgcggct 
tcactgaagc 
catctcacct 
atacgcttga 
cacgtactcg 
ggctcgcgcc 
tcgtcgtgac 
ctggattcat 
ctacccgtga 
acggtatcgc 
tctgagcggg 
cacagacccg 
atcctgttgc 
taataattaa 
cgcaattata 
tatcgcgcgc 
ataattgtca 
agtatcaaac 
ctaagcgtca 
gaccggcagc 
ttgaccgtgt 
agcgggcgcg 
ccggcacaga 
gcggctgcac 
gaagtgacgc 
gccgacgccc 
aggacggcca 
ccgggtacgt 
ccggtttgtc 
agcgccgccg 
ctgcgtatat 
cgctgtactt 
cgccctgcaa 
ccgcgattgg 
gacgattgac 
gccccaggcg 
ggtgcagcca 
gcgcattgag 
aggcacgcgc 
tgagtcccgt 
tcttgaatca 
taaatcaaaa 
ctaagtgccg 
gacacgccag 
aagatgtacg 
cagctaccag 
aggcggcatg 
aggaacgggc 
tggaaccccc 
atcggcgcgg 
cggcaacgca 
atccgcaaag 
aagggcgacg 
agtcgcagca 
gaggtgatcc 
atggccagtg 



ttttgtcaag 1740 
atcgtggctg 1800 
gggaagggac 1860 
tgctcctgcc 1920 
tccggctacc 1980 
gatggaagcc 2040 
agccgaactg 2100 
ccatggcgat 2160 
cgactgtggc 2220 
tattgctgaa 2280 
cgctcccgat 2340 
acGcaagctc 240 0 
gatgatcccc 2460 
cggtcttgcg 2520 
catgtaatgc 2580 
catttaatac 2640 
ggtgtcatct 2700 
ttagattgtt 2760 
ggatgttaat 2820 
atttgtttac 2880 
tcggcacaaa 2940 
tcgccggcat 3000 
aggccgccaa 3060 
tcgcgcacgc 3120 
tgcttggcgt 3180 
ccaccgaggc 3240 
tggcggccgc 33 00 
ggacgaaccg 33 60 
gttcgagccg 342 0 
tgatgccaag 3480 
tctaaaaagg 3540 
gatgcgatga 3 600 
aaccagaaag 3660 
ctcgccgggg 3720 
gcggccgtgc 37 80 
cgcgacgtga 3840 
gcggacttgg 3900 
agcccttacg 3960 
gtcacggatg 4020 
atcggcggtg 4080 
atcacgcagc 4140 
gaacccgagg 42 00 
ctcatttgag 4260 
gccgtccgag 4320 
ccatgaagcg 4380 
cggtacgcca 4440 
agtaaatgag 4500 
gaaaatcaag 4560 
ggttggccag 462 0 
aagcccgagg 4680 
cgctgggtga 4740 
tcgaggcaga 4800 
aatcccggca 4860 
agcaaccaga 4920 
tcatggacgt 4980 
gctacgagct 5040 
tgtgggatta 5100 



BNSOOCID: <WO_ 



03078e29A1J > 



wo 03/078629 



PCT/EP03/02735 



118 

cgacctggta ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg 5160 
gaagggagac aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg 5220 
ccggcgagcc gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa 5280 
caccacgcac gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt 5340 
atccgagggt gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc 5400 
ggagtacatc gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa 5460 
cccggacgtg ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt 5520 
tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac 5580 
gatctacgaa cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa 5640 
gctgatcggg tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg 5700 
cccgatccta gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta 57 60 
atgtacggag cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct 5820 
ctttcctgtg gatagcacgt acattgggaa cccaaagccg tacattggga accggaaccc 5880 
gtacattggg aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat 5940 
aaaagagaaa aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa 6000 
aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc 6060 
gcctaccctt cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc 612 0 
cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc 6180 
cgcgccgtcg ccactcgacc gccggcgccc acatcaaggc accctgcctc gcgcgtttcg 6240 
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 6300 
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 6360 
ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc 6420 
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 6480 
cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg 6540 
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 6600 
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 6660 
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 6720 
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 6780 
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 6840 
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 6900 
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 6960 
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 7020 
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 7080 
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 7140 
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 7200 
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 7260 
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 7320 
gaacgaaaac tcacgttaag ggattttggt catgcatgat atatctccca atttgtgtag 7380 
ggcttattat gcacgcttaa aaataataaa agcagacttg acctgatagt ttggctgtga 7440 
gcaattatgt gcttagtgca tctaacgctt gagttaagcc gcgccgcgaa gcggcgtcgg 7500 
•cttgaacgaa tttctagcta gacattattt gccgactacc ttggtgatct cgcctttcac 7560 
gtagtggaca aattcttcca actgatctgc gcgcgaggcc aagcgatctt cttcttgtcc 7 620 
aagataagcc tgtctagctt caagtatgac gggctgatac tgggccggca ggcgctccat 7680 
tgcccagtcg gcagcgacat ccttcggcgc gattttgccg gttactgcgc tgtaccaaat 7740 
gcgggacaac gtaagcacta catttcgctc atcgccagcc cagtcgggcg gcgagttcca 7800 
tagcgttaag gtttcattta gcgcctcaaa tagatcctgt tcaggaaccg gatcaaagag 7 860 
ttcctccgcc gctggaccta ccaaggcaac gctatgttct cttgcttttg tcagcaagat 7920 
agccagatca atgtcgatcg tggctggctc gaagatacct gcaagaatgt cattgcgctg 7980 
ccattctcca aattgcagtt cgcgcttagc tggataacgc cacggaatga tgtcgtcgtg 8040 
cacaacaatg gtgacttcta cagcgcggag aatctcgctc tctccagggg aagccgaagt 8100 
ttccaaaagg tcgttgatca aagctcgccg cgttgtttca tcaagcctta cggtcaccgt 8160 
aaccagcaaa tcaatatcac tgtgtggctt caggccgcca tccactgcgg agccgtacaa 8220 
atgtacggcc agcaacgtcg gttcgagatg gcgctcgatg acgccaacta cctctgatag 8280 
ttgagtcgat acttcggcga tcaccgcttc ccccatgatg tttaactttg ttttagggcg 8340 
actgccctgc tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta 8400 
acgcgcttgc tgcttggatg cccgaggcat agactgtacc ccaaaaaaac agtcataaca 8460 
agccatgaaa accgccactg eg 84:32 
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<210> 115 
<211> 575 
<212> DNA 

<213> Brassica napus 
<220> 

<221> misc_f eature 

<222> (1) . . (6) 

<223> restriction site 

<220> 

<221> misc_f eature 
<222> (570) . . (575) 
<223> restriction site 

<220> 

<221> misc_f eature 
<222> (7) . . (575) 

<223> coding for liomogentisate-l, 2-dioxygenase (HDG) 

<400> 115 

gtcgacgggc cgatgggggc gaagggtctt gctgcaccaa gagattttct tgcaccaacg 60 
gcatggtttg aggaagggct acggcctgac tacactattg ttcagaagtt tggcggtgaa 120 
ctctttactg ctaaacaaga tttctctccg ttcaatgtgg ttgcctggca tggcaattac 180 
gtgccttata agtatgacct gcacaagttc tgtccataca acactgtcct tgtagaccat 240 
ggagatccat ctgtaaatac agttctgaca gcaccaacgg ataaacctgg tgtggccttg 300 
cttgattttg tcatattccc tcctcgttgg ttggttgctg agcatacctt tcgacctcct 3 60 
tactaccatc gtaactgcat gagtgaattt atgggcctaa tctatggtgc ttacgaggcc 420 
aaagctgatg gatttctacc tggtggcgca agtcttcaca gttgtatgac acctcatggt 480 
ccagatacaa ccacatacga ggcgacgatt gctcgtgtaa atgcaatggc tccttataag 540 
ctcacaggca ccatggcctt catgtttgag gtacc 575 

<210> 116 

<211> 1386 
<212> DNA 

<213> ArabicLopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1383) 

<223> coding for liomogentisate-1, 2 -di oxygenase (HDG) 
<400> 116 

atg gaa gag aag aag aag gag ctt gaa gag ttg aag tat caa' tea ggt 48 
Met Glu Glu I*ys Lys Lys Glu Leu Glu Glu Leu Lys Tyr Gin Ser Gly 

15 10 15 

ttt ggt aac cac ttc tea teg gaa gca ate gee gga get tta eeg tta 9 6 
PtLe Gly Asn His Plie Ser Ser Glu Ala lie Ala Gly TVla Leu Pro Leu 
20 25 30 

gat cag aac agt cct ett ctt tgt ect tac ggt ctt tac gee gaa eag 144 
Asp Gin Asn Ser Pro Leu Leu Cys Pro Tyr Gly Leu Tyr Ala Glu Gin 

35 40 45 

ate tec ggt act tet ttc act tet ect ege aag etc aat caa aga agt 192 
lie Ser Gly Thx Ser Phe Thr Ser Pro Arg Lys Leu Asn Gin Arg Ser 
50 55 60 

tgg ttg tac egg gtt aaa eca teg gtt aca cat gaa ecg ttc aag cct 240 
Trp Leu Tyr Arg Val Lys Pro Ser Val Tlir His Glu Pro Phe Lys Pro 
65 70 75 80 

cgt gta eca get cat aag aag ctt gtg agt gag ttt gat gca tea aat 2 88 
Arg Val Pro Ala His Lys Lys Leu Val Ser Glu Phe Asp Ala Ser Asn 

85 90 95 
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agt cgt acg aat ccg act cag ctt egg tgg aga cct gag gat att cct 
Ser Arg Tlir Asn Pro Thr Gin Leu Arg Trp Arg Pro Glu Asp lie Pro 
100 105 110 

gat teg gag att gat ttc gtt gat ggg tta ttt acc att tgt gga get 
Asp Ser Glu lie Asp Plie Val Asp Gly Leu Pbe Thr lie Cys Gly Ala 

115 120 125 

gga age teg ttt ctt egc cat ggc ttc get att eac atg tat gtg get 
Gly Ser Ser Plie Leu Arg His Gly Phe Ala lie His Met Tyr Val Ala 

130 135 140 

aac aca gga atg aaa gae tee gea ttt tge aac get gat ggt gac ttc 
Asn Thr Gly Met Lys Asp Ser Ala Phe Cys Asn Ala Asp Gly Asp Plie 
145 150 155 160 

ttg tta gtt cct caa aca gga agg eta tgg att gaa act gag tgt gga 
Leu Leu Val Pro Gin Thr Gly Arg Leu Trp He Glu Thr Glu Cys Gly < 
165 170 175 

agg ctt ttg gta act cct ggt gag att get gtt ata cca caa ggt ttc 
Arg Leu Leu Val Thr Pro Gly Glu He Ala Val He Pro Gin Gly Phe 
lao 185 . 190 

cgt ttc tec ata gat tta ccg gat ggg aag tct cgt ggt tat gtt get 
Arg Phe Ser He Asp Leu Pro Asp Gly Lys Ser Arg Gly Tyr Val Ala 

195 200 205 

gaa ate tat ggg get cat ttt cag ctt cct gat ctt gga cca ata ggt 
Glu He Tyr Gly Ala His Phe Gin Leu Pro Asp Leu Gly Pro He Gly 
210 215 220 

get aat ggt ctt get gca tea aga gat ttt ctt gea cca aca gca tgg 
Ala Asn Gly Leu Ala Ala Ser Arg Asp Phe Leu Ala Pro Thr Ala Trp 
225 230 235 240 

ttt gag gat gga ttg egg cct gaa tac aca att gtt cag aag ttt ggc 
Phe Glu Asp Gly Leu Arg Pro Glu Tyr Thr He Val Gin Lys Phe Gly 
245 250 255 

ggt gaa etc ttt act get aaa caa gat ttc tct cca ttc aat gtg gtt 
Gly Glu Leu Phe Thr Ala Lys Gin Asp Phe Ser Pro Phe Asn Val Val 
260 265 270 

gee tgg cat ggc aat tac gtg cct tat aag tat gac ctg aag aag ttc 
Ala Trp His Gly Asn Tyr Val Pro Tyr Lys Tyr Asp Leu Lys Lys Phe 

275 280 285 

tgt cca tac aac act gtg ctt tta gat cat gga gat cca tct ata aat 
Cys Pro Tyr Asn Thr Val Leu Leu Asp His Gly Asp Pro Ser He Asn 
290 295 300 

aca gte ctt aca gca cca act gat aaa cct ggt gtg gee ttg ctt gat 
Thr Val Leu Thr Ala Pro Thr Asp Lys Pro Gly Val Ala Leu Leu Asp 
305. 310 315 320 

ttt gtc ata ttt cct cct ega tgg ttg gtt get gag eat act ttt ega 
Phe Val He Phe Pro Pro Arg Trp Leu Val Ala Glu His Thr Phe Arg 
325 330 335 

cct cct tac tat eat cgt aac tge atg agt gaa ttt atg ggc tta ate 
Pro Pro Tyr Tyr His Arg Asn Cys Met Ser Glu Phe Met Gly Leu He 
340 345 350 

tac ggt gea tac gag geg aaa get gat gga ttt etc cct ggc ggt gca 
Tyr Gly Ala Tyr Glu Ala Lys Ala Asp Gly Phe Leu Pro Gly Gly Ala 
355 360 365 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 
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agt ctt cat age tgt atg aca cct cat ggt cca gat act acc acg tac 1152 
Ser Leu His Ser Cys Met Thr Pro His Gly Pro Asp Tlir Thr Tlir Tyr 
370 375 380 

gag gcg aca att get cga gta aat gca atg get eet tct aaa etc aca 1200 
Glu Ala Thr lie Ala Arg Val Asn Ala Met Ala Pro Ser Lys Leu Tlir 
385 390 395 400 

ggt acg atg get ttc atg ttc gaa tea gca ttg ate cct aga gtc tgt 1248 
Gly Thr Met Ala Phe Met Phe Glu Ser Ala Leu lie Pro Arg Val Cys 

405 410 415 

cat tgg get etg gag tct cct ttc ctg gat cae gae tac tac cag tgt 1296 
His Trp Ala Leu Glu Ser Pro Phe Leu Asp His Asp Tyr Tyr Gin Cys 
420 425 430 

tgg att ggc etc aag tct cat ttc teg cgc ata age ttg gac aag aca 1344 
Trp lie Gly Leu Lys Ser His Ph.e Ser Arg lie Ser Leu Asp Lys Tlir 
435 440 445 

aat gtt gaa tea aca gag aaa gaa cca gga get teg gag taa 1386 
Asn Val Glu Ser Thx Glu Lys Glu Pro' Gly Ala Ser Glu 
450 455* 460 

<210> 117 
<211> 461 
<212> PRT 

<213> Arabidopsis tlialiana 
<400> 117 

Met Glu Glu Lys Lys Lys Glu Leu Glu Glu Leu Lys Tyr Gin Ser Gly 
15 10 15 

Pile Gly Asn His Phe Ser Ser Glu Ala lie Ala Gly Ala Leu Pro Leu 
20 25 30 

Asp Gin Asn Ser Pro Leu Leu Cys Pro Tyr Gly Leu Tyr Ala Glu Gin 
35 40 . 45 

lie Ser Gly Tlir Ser Phe Tlir Ser Pro Arg Lys Leu Asn Gin Arg Ser 
50 55 60 

Trp Leu Tyr Arg Val Lys Pro Ser Val Thr His Glu Pro Phe Lys Pro 
65 70 75 80 

Arg Val Pro Ala His Lys Lys Leu Val Ser Glu Phe Asp Ala Ser Asn 

85 90 95 

Ser Arg Thr Asn Pro Thr Gin Leu Arg Trp Arg Pro Glu Asp lie Pro 

100 105 110 

Asp Ser Glu lie Asp Phe Val Asp Gly Leu Phe Thr lie Cys Gly Ala 
115 120 125 

Gly Ser Ser Phe Leu Arg His Gly Phe Ala lie His Met Tyr Val Ala 
130 135 140 

Asn Thr Gly Met Lys Asp Ser Ala Phe Cys Asn Ala Asp Gly Asp Phe 
145 150 155 160 

Leu Leu Val Pro Gin Thr Gly Arg Leu Trp He Glu Thr Glu Cys Gly 
165 170 175 

Arg Leu Leu Val Thr Pro Gly Glu He Ala Val He Pro Gin Gly Phe 
180 185 190 

Arg Phe Ser He Asp Leu Pro Asp Gly Lys Ser Arg Gly Tyr Val Ala 
195 200 205 
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Glu lie Tyr Gly Ala His Phe Gin Leu Pro Asp Leu Gly Pro lie Gly 
210 215 220 

Ala Asn Gly Leu Ala Ala Ser Arg Asp Phe Leu Ala Pro Thr Ala Trp 
225 230 235 240 

Phe Glu Asp Gly Leu Arg Pro Glu Tyr Thr He Val Gin Lys Phe Gly 
245 250 255 

Gly Glu Leu Phe Thr Ala Lys Gin Asp Phe Ser Pro Phe Asn Val Val 

260 265 270 

Ala Trp His Gly Asn Tyr Val Pro Tyr Lys Tyr Asp Leu Lys Lys Phe 
275 280 285 

Cys Pro Tyr Asn Thr Val Leu Leu Asp His Gly Asp Pro Ser He Asn 
290 295 300 

Thr Val Leu Thr Ala Pro Thr Asp Lys Pro Gly Val Ala Leu Leu Asp 
305 310 315 320 

Phe Val He Phe Pro Pro Arg Trp Leu Val Ala Glu His Thr Phe Arg 
325 330 335 

Pro Pro Tyr Tyr His Arg .Asn Cys Met Ser Glu Phe Met Gly Leu He 
340 345 350 

Tyr Gly Ala Tyr Glu Ala Lys Ala Asp Gly Phe Leu Pro Gly Gly Ala 
355 360 365 

Ser Leu His Ser Cys Met Thr Pro His Gly Pro Asp Thr Thr Thr Tyr 
370 375 380 

Glu Ala Thr He Ala Arg Val Asn Ala Met Ala Pro Ser Lys Leu Thr 
385 390 395 400 

Gly Thr Met Ala Phe Met Phe Glu Ser Ala Leu He Pro Arg Val Cys 
405 410 415 

His Trp Ala Leu Glu Ser Pro Phe Leu Asp His Asp Tyr Tyr Gin Cys 
420 425 430 

Trp He Gly Leu Lys Ser His Phe Ser Arg He Ser Leu Asp Lys Thr 
• 435 440 445 

Asn Val Glu Ser Thr Glu Lys Glu Pro Gly Ala Ser Glu 
450 455 460 



<210> 118 
<211> 815 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (37) . . (705) 

<223> coding for maleylacetoacetate isomerase (MAAI) 
<400> 118 

gtaatctccg aagaagaaca aattccttgc tgaatc atg tct tat gtt acc .gat 54 

Met Ser Tyr Val Thr Asp 
1 5 

ttt tat cag gcg aag ttg aag etc tac tct tac tgg aga age tea tgt 102 
Phe Tyr Gin Ala Lys Leu Lys Leu Tyr Ser Tyr Trp Arg Ser Ser Cys 
10 15 20 
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get cat cgc gtc cgt ate gcc etc act tta aaa ggg ctt gat tat gaa 150 
Ala His Arg Val Arg lie Ala Leu Thr Leu Lys Gly Leu Asp Tyr Glu 
25 30 35 

tat ata ccg gtt aat ttg etc aaa ggg gat caa tec gat tea gat ttc 198 
Tyr He Pro Val Asn Leu Leu Lys Gly Asp Gin Ser Asp Ser Asp Piie 
40 45 50 

aag aag ate aat cca atg gge act gta cca gcg ctt gtt gat ggt gat 246 
Lys Lys He Asn Pro Met Gly T?hr Val Pro Ala Leu Val Asp Gly Asp 
55 60 65 70 

gtt gtg att aat gac tet ttc gea ata ata atg tac etg gat gat aag 294 
Val Val He Asn Asp Ser Plie Ala He He Met Tyr Leu Asp Asp Lys 

75 80 85 

tat ccg gag cca ccg etg tta cca agt gac tac cat aaa egg gcg gta 342 
Tyr Pro Glu Pro Pro Leu Leu Pro Ser Asp Tyr His Lys Arg Ala Val 
90 95 100 

aat tac cag gcg aeg agt att gtc atg tet ggt ata cag cet cat caa 390 
Asn Tyr Gin Ala Thr Ser He Val Met Ser Gly He Gin Pro His Gin 
105 110 115 

aat atg get ctt ttt agg tat etc gag gac aag ata aat get gag gag 438 
Asn Met Ala Leu Phe Arg Tyr Leu Glu Asp Lys He Asn Ala Glu Glu 
120 125 130 

aaa act get tgg att act aat get ate aca aaa gga ttc aca get etc 486 
Lys Thr Ala Trp He Thr Asn Ala He Thr Lys Gly Phe Thr Ala Leu 

135 140 145 150 

gag aaa etg ttg gtg agt tge get gga aaa tac gcg act ggt gat gaa 534 
Glu Lys Leu Leu Val Ser Cys Ala Gly Lys Tyr Ala Thr Gly Asp Glu 

155 160 165 

gtt tac ttg get gat ctt ttc eta gea cca cag ate cae gea gea ttc 582 
Val Tyr Leu Ala Asp Leu Phe Leu Ala Pro Gin He His Ala Ala Phe 
170 175 180 

aac aga ttc cat att aac atg gaa cca ttc ccg act ctt gea agg ttt 630 
Asn Arg Phe His He Asn Met Glu Pro Phe Pro Thr Leu Ala Arg Phe 
185 190 195 

tac gag tea tac aac gaa etg ect gea ttt caa aat gea gtc ccg gag 678 
Tyr Glu Ser Tyr Asn Glu Leu Pro .Ala Phe Gin Asn Ala Val - Pro Glu 
200 205 ' 210 

aag caa cca gat act cet tee ace ate tgattetgtg aacegtaage 725 
Lys Gin Pro Asp Thr Pro Ser Thr He 
215 220 

ttctctcagt ctcagctcaa taaaatctet taggaaacaa caacaacace ttgaacttaa 7 85 

atgtatcata tgaaccagtt tacaaataat 815 

<210> 119 
<211> 223 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 119 

Met Ser Tyr Val Thr Asp Phe Tyr Gin Ala Lys Leu Lys Leu Tyr Ser 
15 10 15 

Tyr Trp Arg Ser Ser Cys Ala His Arg Val Arg He Ala Leu Thr Leu 
20 25 30 
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Lys Gly Leu Asp Tyr Glu Tyr lie Pro Val Asn Leu Leu Lys Gly Asp 
35 40 45 

Gin Ser Asp Ser Asp Phe Lys Lys lie Asn Pro Met Gly Thr Val Pro 
50 55 60 

Ala Leu Val Asp Gly Asp Val Val lie Asn Asp Ser Phe Ala lie lie 
65. 70 75 80 

Met Tyr Leu Asp Asp Lys Tyr Pro Glu Pro Pro Leu Leu Pro Ser Asp 

85 90 95 

Tyr His Lys Arg Ala Val Asn Tyr Gin Ala Tlir Ser lie Val Met Ser 
100 105 110 

Gly He Gin Pro His Gin Asn Met Ala Leu Ptie Arg Tyr Leu Glu Asp 
115 120 125 

Lys He Asn Ala Glu Glu Lys Thr Ala Trp He Thr Asn Ala He Thr 
130 135 140 

Lys Gly Phe Thr Ala Leu Glu Lys Leu Leu Val Ser Cys Ala Gly Lys 
145 150 155 160 

Tyr Ala Thr Gly Asp Glu Val Tyr Leu Ala Asp Leu Phe Leu Ala Pro 
165 170 175 

Gin He His Ala Ala Phe Asn Arg Phe His He Asn Met Glu Pro Phe 
180 185 190 

Pro Thr Leu Ala Arg Phe Tyr Glu Ser Ty^^ Asn Glu Leu Pro Ala Phe 
195 200 205 

Gin Asn Ala Val Pro Glu Lys Gin Pro Asp Thr Pro Ser Thr He 
210 215 220 



48 



<210> 120 
<211> 1227 
<212> DNA 

<213> Arabidopsis thaliana 

<220> ■ 
<221> CDS 
<222> (1) . . {1224) 

<223> coding for fumarylacetoacetate hydrolase (FAAH) 
<400> 120 

atg gcg ttg ctg aag tct ttc ate gat gtt ggc tea gac teg cae ttc 
Met Ala Leu Leu Lys Ser Phe He Asp Val Gly Ser Asp Ser His Phe 
1 5 10 15 

cct ate cag aat etc cet tat ggt gtc ttc aaa ccg gaa teg aae tea 96 
Pro He Gin Asn Leu Pro Tyr Gly Val Phe Lys Pro Glu Ser Asn Ser 
20 25 30 

act cct cgt cct gcc gtc get ate ggc gat ttg gtt etg gac etc tec 144 
Thr Pro Arg Pro Ala Val Ala He Gly Asp Leu Val Leu Asp Leu Ser 
35 40 45 

get ate tct gaa get ggg ett ttc gat ggt ctg ate ctt aag gac gca 192 
Ala He Ser Glu Ala Gly Leu Phe Asp Gly Leu He Leu Lys Asp Ala 
50 55 60 

gat tge ttt ett cag cct aat ttg aat aag ttc ttg gee atg gga egg 240 
Asp Cys Phe Leu Gin Pro Asn Leu Asn Lys Phe Leu Ala Met Gly Arg 
65 70 75 80 
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cct gcg tgg aag gaa gcg cgt tct acg ctg caa aga ate ttg tea ttt 288 
Pro Ala Trp Lys Glu Ala Arg Ser Th.r Leu Gin Arg lie Leu Ser Plie 

85 90 95 

ttg tta ttt ggc ttc aag gtt ttg gtt ttg gta tgt ttt cat gca get 336 
Leu Leu Phe Gly Plie Lys Val Leu Val Leu Val Cys Plie His Ala Ala 
100 105 110 

aat gaa cct ate ttg cga gac aat gat gtt ttg agg aga aaa tea ttc 3 84 
Ash Glu Pro lie Leu Arg Asp Asn Asp Val Leu Arg Arg Lys Ser Phe 
115 120 125 

cat cag atg agt aaa gtg gaa atg att gtt cct atg gtg att ggg gac 432 
His Gin Met Ser Lys Val Glu Met He Val Pro Met Val He Gly Asp 
130 135 140 

tat aca gac ttc ttt gca tct atg cat cac gcg aag aac tgc gga ctt 480 
Tyr Tlir Asp Plie Ptie Ala Ser Met His His Ala Lys Asn Cys Gly Leu 
145 150 155 160 

atg ttc cgt ggg cct gag aat gcg ata aac cea aat tgg ttt cgt ctt 528 
Met Pile Arg Gly Pro Glu Asn Ala He Asn Pro Asn .Trp Plie Arg Leu 

165 170 175 

ccc att gca tat cat gga egg gca tea tct att gtc ate tct ggg act 576 
Pro He Ala Tyr His Gly Arg Ala Ser Ser He Val He Ser Gly Tlir 
180 185 190 

gac att att cga cea aga ggt cag ggc cat cea caa gga aac tct gaa 624 
Asp He He Arg Pro Arg Gly Gin Gly His Pro Gin Gly Asn Ser Glu 
195 200 205 

cea tat ttt gga cct teg aag aaa ctt gat ttt gag ctt gag atg get 672 
Pro Tyr Plie Gly Pro Ser Lys Lys Leu Asp Plie Glu Leu Glu Met Ala 
210 215 220 

get gtg gtt ggt cea gga aat gaa ttg gga aag cct att gac gtg aat 720 
Ala Val Val Gly Pro Gly Asn Glu Leu Gly Lys Pro He Asp Val Asn 
225 230 235 240 

aat gca gee gat cat ata ttt ggt eta tta ctg atg aat gac tgg agt 768 
Asn Ala Ala Asp His He Plie Gly Leu Leu Leu Met Asn Asp Trp Ser 

245 250 255 

get agg gat att cag gcg tgg gag tat gta cct ctt ggt cct. ttc ctg 816 
Ala Arg Asp He Gin Ala Trp Glu Tyr Val Pro Leu Gly Pro Phe Leu 
260 265 270 

ggg aag agt ttt ggg act act ata tec cct tgg att gtt ace ttg gat 864 
Gly Lys Ser Plie Gly Thr Thr He Ser Pro Trp He Val Tlir Leu Asp 
275 280 285 

gcg ctt gag cct ttt ggt tgt caa get ccc aag cag gat cea cct cea 912 
Ala Leu Glu Pro Plie Gly Cys Gin Ala Pro Lys Gin Asp Pro Pro Pro 

290 295 300 

ttg cea tat ttg get gag aaa gag tct gta aat tac gat ate tee ttg 960 
Leu Pro Tyr Leu Ala Glu Lys Glu Ser Val Asn Tyr Asp He Ser Leu 
305 310 315 320 

gag eta gca cac cat ace gtt aac ggt tgc aat ttg agg cct ggt gat 1008 
Glu Leu Ala His His Thr Val Asn Gly Cys Asn Leu Arg Pro Gly Asp 

325 330 335 

etc ctt ggc aca gga ace ata age gga eeg gag cea gat tea tat ggg 1056 
Leu Leu Gly Thr Gly Thr He Ser Gly Pro Glu Pro Asp Ser Tyr Gly 
340 345 350 
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tgc eta ctt gag ttg aca tgg aat gga cag aaa cct eta tea etc aat 1104 

Cys Leu Leu Glu Leu Tlir Trp Asn Gly Gin Lys Pro Leu Ser Leu Asn 
355 360 365 

gga aca act cag acg ttt etc gaa gac gga gac caa gtc acc ttc tea 1152 
Gly Thx Thr Gin Tlir Phe Leu Glu Asp Gly Asp Gin Val Tlur Phe Ser 
370 375 380 

ggt gta tgc aag gga gat ggt tac aat gtt ggg ttt gga aea tgc aca 1200 
Gly Val Cys Lys Gly Asp Gly Tyr Asn Val Gly Phe Gly Thr Cys Thr 
385 390 395 400 

ggg aaa att gtt cct tea ccg cct tga 1227 
Gly Lys lie Val Pro Ser Pro Pro 
405 

<210> 121 
<211> 408 
<212> PRT 

<213> Arabidppsis thaliana 
<400> 121 

Met Ala Leu Leu Lys Ser Phe lie Asp Val Gly Ser Asp Ser His Phe 
• 1 5 10 15 

Pro lie Gin Asn Leu Pro Tyr Gly Val Phe Lys Pro Glu Ser Asn Ser 
20 25 30 

Thr Pro Arg Pro Ala Val Ala lie Gly Asp Leu Val Leu Asp Leu Ser 
35 40 45 

Ala lie Ser Glu Ala Gly Leu Phe Asp Gly Leu lie Leu Lys Asp Ala 
50 55 60 

Asp Cys Phe Leu Gin Pro Asn Leu Asn Lys Phe Leu Ala Met Gly Arg 
65 70 75 80 

Pro Ala Trp Lys Glu Ala Arg Ser Thr Leu Gin Arg lie Leu Ser Phe 

85 90 95 

Leu Leu Phe Gly Phe Lys Val Leu Val Leu Val Cys Phe His Ala Ala 
100 105 110 

Asn Glu Pro lie Leu Arg Asp Asn Asp Val Leu Arg Arg Lys Ser Phe 
115 120 125 

His Gin Met Ser Lys Val Glu Met He Val Pro Met Val He Gly Asp 
130 135 140 

Tyr Thr Asp Phe Phe Ala Ser Met His His Ala Lys Asn Cys Gly Leu 
145 150 155 160 

Met Phe Arg Gly Pro Glu Asn Ala He Asn Pro Asn Trp Phe Arg Leu 

165 170 175 

Pro He Ala Tyr His Gly Arg Ala Ser Ser He Val He Ser Gly Thr 
180 185 190 

Asp He He Arg Pro Arg Gly Gin Gly His Pro Gin Gly Asn Ser Glu 

195 200 205 

Pro Tyr Phe Gly Pro Ser Lys Lys Leu Asp Phe Glu Leu Glu Met Ala 
210 215 220 

Ala Val Val Gly Pro Gly Asn Glu Leu Gly Lys Pro He Asp Val Asn 

225 230 235 240 

Asn. Ala Ala Asp His He Phe Gly Leu Leu Leu Met Asn Asp Trp Ser 

245 250 255 
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Ala Arg Asp lie Gin Ala Txp Glu Tyr Val Pro Leu Gly Pro Phe Leu 
260 265 270 

Gly Lys Ser Phe Gly Thr Thr lie Ser Pro Trp lie Val Thr Leu Asp 
275 280 285 

Ala Leu Glu Pro Plie Gly Cys Gin Ala Pro Lys Gin Asp Pro Pro Pro 

290 295 300 

Leu Pro Tyr Leu Ala Glu Lys Glu Ser Val Asn Tyr Asp lie Ser Leu 
305 310 315 320 

Glu Leu Ala His His Tlir Val Asn Gly Cys Asn Leu Arg Pro Gly Asp 

325 330 335 

Leu Leu Gly Thr Gly Thr lie Ser Gly Pro Glu Pro Asp Ser Tyr Gly 
340 345 350 

Cys Leu Leu Glu Leu Thr Trp Asn Gly Gin Lys Pro Leu Ser Leu Asn 
355 360 365 

Gly Thr Thr Gin Thr Phe Leu Glu Asp Gly Asp Gin Val Thr Phe Ser 
370 375 380 

Gly Val Cys Lys Gly Asp Gly Tyr Asn Val Gly Phe Gly Thr Cys Thr 
385 390 395 400 

Gly Lys lie Val Pro Ser Pro Pro 
405 



<210> 122 
<211> 11667 
<212> DNA 

<213> Ktinstliche Sec[uenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : supression 
construct 2 p3300 • l~Tocl59-GFP-KNAi 

<400> 122 

aattcgtttc tccataataa tgtgtgagta gttcccagat aagggaatta gggttcctat 60 
agggtttcgc tcatgtgttg agcatataag aaacccttag tatgtatttg tatttgtaaa 120 
atacttctat caataaaatt tctaattcct aaaaccaaaa tccagtacta aaatccagat 180 
cccccgaatt aattcggcgt taattcagca attcgtaatc atggtcatag ctgtttcctg 240 
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 3 00 
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 360 
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 420 
gaggcggttt gcgtattggc tagagcagct tgccaacatg gtggagcacg acactctcgt 480 
ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg agacttttca 540 
acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct gtcacttcat 600 
caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg ataaaggaaa 660 
ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 720 
gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 780 
taacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata cagtctcaga 840 
agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc tcctcggatt 900 
ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag gtggcaccta 960 
caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg ccgacagtgg 1020 
tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg ttccaaccac 1080 
gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg acgcacaatc 1140 
ccactatcct tcgcaagacc ttcctctata taaggaagtt catttcattt ggagaggaca 1200 
cgctgaaatc accagtctct ctctacaaat ctatctctct cgagtctacc atgagcccag 12 60 
aacgacgccc ggccgacatc cgccgtgcca ccgaggcgga catgccggcg gtctgcacca 1320 
tcgtcaacca ctacatcgag acaagcacgg tcaacttccg taccgagccg caggaaccgc 1380 
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aggagtggac ggacgacctc gtccgtctgc gggagcgcta tccctggctc gtcgccgagg 1440 
tggacggcga ggtcgccggc atcgcctacg cgggcccctg gaaggcacgc aacgcctacg 1500 
actggacggc cgagtcgacc gtgtacgtct ccccccgcca ccagcggacg ggactgggct 1560 
ccacgctcta cacccacctg ctgaagtccc tggaggcaca gggcttcaag agcgtggtcg 1620 
ctgtcatcgg gctgcccaac gacccgagcg tgcgcatgca cgaggcgctc ggatatgccc 1680 
cccgcggcat gctgcgggcg gccggcttca agcacgggaa ctggcatgac gtgggtttct 1740 
ggcagctgga cttcagcctg ccggtaccgc cccgtccggt cctgcccgtc accgagattt 1800 
gactcgagtt tctccataat aatgtgtgag tagttcccag ataagggaat tagggttcct 1860 
atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt tgtatttgta 1920 
aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtac taaaatccag 1980 
atcccccgaa ttaattcggc gttaattcag tacattaaaa acgtccgcaa tgtgttatta 2040 
agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc cagccaacag 2100 
ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc atcagtccgg 2160 
gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt accgatgcta 2220 
ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg cggagggtag 2280 
catgttgatt .gtaacgatga cagagcgttg ctgcctgtga tcaccgcggt ttcaaaatcg 2340 
gctccgtcga tactatgtta tacgccaact ttgaaaacaa ctttgaaaaa gctgttttct 2400 
ggtatttaag gttttagaat gcaaggaaca gtgaattgga gttcgtcttg ttataattag 2460 
cttcttgggg tatctttaaa tactgtagaa aagaggaagg aaataataaa tggctaaaat 252 0 
gagaatatca ccggaattga aaaaactgat cgaaaaatac cgctgcgtaa aagatacgga 2580 
aggaatgtct cctgctaagg tatataagct ggtgggagaa aatgaaaacc tata'tttaaa 2 640 
aatgacggac agccggtata aagggaccac ctatgatgtg gaacgggaaa aggacatgat 2700 
gctatggctg gaaggaaagc tgcctgttcc aaaggtcctg cactttgaac ggcatgatgg 2760 
ctggagcaat ctgctcatga gtgaggccga tggcgtcctt tgctcggaag agtatgaaga 2 82 0 
tgaacaaagc cctgaaaaga ttatcgagct gtatgcggag tgcatcaggc tctttcactc 2880 
catcgacata tcggattgtc cctatacgaa tagcttagac agccgcttag ccgaattgga 2940 
ttacttactg aataacgatc tggccgatgt ggattgcgaa aactgggaag aagacactcc 3 000 
atttaaagat ccgcgcgagc tgtatgattt tttaaagacg gaaaagcccg aagaggaact 3060 
tgtcttttcc cacggcgacc tgggagacag caacatcttt gtgaaagatg gcaaagtaag 3120 
tggctttatt gatcttggga gaagcggcag ggcggacaag tggtatgaca ttgccttctg 3180 
cgtccggtcg atcagggagg atatcgggga agaacagtat gtcgagctat tttttgactt 3240 
actggggatc aagcctgatt gggagaaaat aaaatattat attttactgg atgaattgtt 3300 
ttagtaccta gaatgcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 33 60 
agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 3420 
ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 3480 
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgtcct 3540 . 
tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 3 600 
cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 3 660 
gttggactca agacgatagt taccggataa ggcigcagcgg tcgggctgaa cggggggttc 3720 
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 3780 
gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 3 840 
cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 3900 
tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 3960 
ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 4020 
ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 4080 
taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 4140 
agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc atctgtgcgg 42 00 
tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgrccg catagttaag 42 60 
ccagtataca ctccgctatc gctacgtgac tgggtcatgg ctgcgccccg acacccgcca 4320 
acacccgctg acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct 4380 
gtgaccgtct ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg 4440 
aggcagggtg ccttgatgtg ggcgccggcg gtcgagtggc gacggcgcgg cttgtccgcg 4500 
ccctggtaga ttgcctggcc gtaggccagc catttttgag cggccagcgg ccgcgatagg 4560 
ccgacgcgaa gcggcggggc gtagggagcg cagcgaccga agggtaggcg ctttttgcag 4620 
ctcttcggct gtgcgctggc cagacagtta tgcacaggcc aggcgggttt taagagtttt 4 680 
aataagtttt aaagagtttt aggcggaaaa atcgcctttt ttctctttta tatcagtcac 4740 
ttacatgtgt gaccggttcc caatgtacgg ctttgggttc ccaatgtacg ggttccggtt 4800 
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cccaatgtac ggctttgggt tcccaatgta 
acctttttcc cctgctaggg caatttgccc 
ggatgcttcg ccctcgatca ggttgcggta 
cgcctcctcc ttcaaatcgt actccggcag 
gaaacagaac ttcttgaact ctccggcgct 
ccatctggct tctgccttgc ctgcggcgcg 
gccgggatcg atcaaaaagt aatcggggtg 
tgtgatctcg cggtacatcc aatcagctag 
ttcgctcttt acgatcttgt agcggctaat 
gcggccgttc ttggccttct tcgtacgctg 
gcaggtttct accaggtcgt ctttctgctt 
tacgtccgca acgtgtggac ggaacacgcg 
tcggttcatg gattcggtta gatgggaaac 
actggccatg ccggccggcc ctgcggaaac 
gatcacctcg ccagctcgtc ggtcacgctt 
gctgcgacta tcgcgggtgc ccacgtcata 
gtcgcccttg ggcggcttcc taatcgacgg 
tttgcggatt cgatcagcgg ccgcttgcca 
gcgttgccgc tgggcggcct gcgcggcctt 
cgcgccgatt tgtaccgggc cggatggttt 
gggttccagt gccattgcag ggccggcaga 
ccgttcctcc acacatgggg cattccacgg 
tgccgcctcc tttagccgct aaaattcatc 
ggtagctgcg cgatgtattc agatagcagc 
tacatcttca gcttggtgtg atcctccgcc 
ggcgtgtctg ccaggctggc caacgttgca 
gcacttagcg tgtttgtgct tttgctcatt 
ttgatttaat ttcagcggcc agcgcctgga 
attcaagaac ggttgtgccg gcggcggcag 
gggactcaag aatgggcagc tcgtacccgg 
gcgtgccttt gatcgcccgc gacacgacaa 
caatgcgctg cttaaccagc tccaccaggt 
gctgcaccgg aatcagcacg aagtcggctg 
cctggggcgc tccgtcgatc actacgaagt 
caatcgtcgg gcggtcgatg ccgacaacgg 
aatcgcgggc actgccctgg ggatcggaat 
gcagggcgcg ggctagatgg gttgcgatgg 
gtacagcgat aaccttcatg .cgttcccctt 
atacgcagcg acc'gcatgac gcaagctgtt 
gcggcgctcg gtttcttcag cggccaagct 
caaaccggcc aggatttcat gcagccgcac 
gtacccggcc gcgatcatct ccgcctcgat 
gccgtcctgg tgcggtttca tgcttgttcc 
gcgtcggcct cggtcaatgc gtcctcacgg 
gtcacttcct cgctgcgctc aagtgcgcgg 
gcagccgcct ctttcacggt gcggccttcc 
tgtgccgggg tgagggtagg gcgggggcca 
cgcccgctcc gggtgcggtc gatgattagg 
acggtcaaca ccatgcggcc ggccggcgtg 
cgcaggcccg cgccggcctc ctggatgcgc 
cgggccaggc ggtctagcct ggtcactgtc 
atcctggcca gctccgggcg gtcgcgcctg 
gtgcagccgg ccgcgtgcag ttcggcccgt 
acgcgggcat agcccagcag gccagcggcg 
ttctagtcgc aagtattcta ctttatgcga 
aagggcaggg cggcagcctg tcgcgtaact 
gacggctgca ctgaacgtca gaagccgact 
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cgtgctatcc acaggaaaga gaccttttcg 4860 
tagcatctgc tccgtacatt aggaaccggc 4920 
gcgcatgact aggatcgggc cagcctgccc 4980 
gtcatttgac ccgatcagct tgcgcacggt 5040 
gccactgcgt tcgtagatcg tcttgaacaa 5100 
gcgtgccagg cggtagagaa aacggccgat 5160 
aaccgtcagc acgtccgggt tcttgccttc 5220 
ctcgatctcg atgtactccg gccgcccggt 5280 
caaggcttca ccctcggata ccgtcaccag 5340 
catggcaacg tgcgtggtgt ttaaccgaat 5400 
tccgccatcg gctcgccggc agaacttgag 5460 
gccgggcttg tctcccttcc cttcccggta 5520 
cgccatcagt accaggtcgt aatcccacac 5580 
ctctacgtgc ccgtctggaa gctcgtagcg 5640 
cgacagacgg aaaacggcca cgtccatgat 5700 
gagcatcgga acgaaaaaat ctggttgctc 5760 
cgcaccggct gccggcggtt gccgggattc 5820 
cgattcaccg gggcgtgctt ctgcctcgat 5880 
caacttctcc accaggtcat cacccagcgc 5940 
gcgaccgtca cgccgattcc* tcgggcttgg 6000 
caacccagcc gcttacgcct ggccaaccgc 6060 
cgtcggtgcc tggttgttct tgattttcca 6120 
tactcattta ttcatttgct catttactct 6180 
tcggtaatgg tcttgccttg gcgtaccgcg 6240 
ggcaactgaa agttgacccg cttcatggct 6300 
gccttgctgc tgcgtgcgct cggacggccg 6360 
ttctctttac ctcattaact caaatgagtt 6420 
cctcgcgggc agcgtcgccc tcgggttctg 6480 
tgcctgggta gctcacgcgc tgcgtgatac 6540 
ccagcgcctc ggcaacctca ccgccgatgc 6600 
aggccgcttg tagccttcca tccgtgacct 6660 
cggcggtggc ccatatgtcg taagggcttg 6720 
ccttgatcgc ggacacagcc aagtccgccg 6780 
cgcgccggcc gatggccttc acgtcgcggt 6840 
ttagcggttg atcttcccgc acggccgccc 6900 
cgactaacag aacatcggcc ccggcgagtt 6960 
tcgtcttgcc tgacccgcct ttctggttaa 7020 
gcgtatttgt ttatttactc. atcgcatcat 7080 
ttactcaaat acacatcacc tttttagacg 7140 
ggccggccag gccgccagct tggcatcaga 7200 
ggttgagacg tgcgcgggcg gctcgaacac 7260 
ctcttcggta atgaaaaacg gttcgtcctg 7320 
tcttggcgtt cattctcggc ggccgccagg 7380 
aaggcaccgc gccgcctggc ctcggtgggc 7440 
tacagggtcg agcgatgcac gccaagcagt 7500 
tggtcgatca gctcgcgggc gtgcgcgatc 7560 
aacttcacgc ctcgggcctt ggcggcctcg 7620 
gaacgctcga actcggcaat gccggcgaac 7680 
gtggtgtcgg cccacggctc tgccaggcta 7740 
tcggcaatgt ccagtaggtc gcgggtgctg 7800 
acaacgtcgc cagggcgtag gtggtcaagc 7860 
gtgccggtga tcttctcgga aaacagcttg 7920 
tggttggtca agtcctggtc gtcggtgctg 79 80 
gcgctcttgt tcatggcgta atgtctccgg 8040 
ctaaaacacg cgacaagaaa acgccaggaa 8100 
taggacttgt gcgacatgtc gttttcagaa 8160 
gcactatagc agcggagggg ttggatcaaa 8220 
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gtactttgat cccgagggga accctgtggt tggcatgcac atacaaatgg acgaacggat 8280 
aaaccttttc acgccctttt aaatatccgt tattctaata aacgctcttt tctcttaggt 8340 
ttacccgcca atatatcctg tcaaacactg atagtttaaa ctgaaggcgg gaaacgacaa 8400 
tctgatccaa gctcaagctg ctctagcatt cgccattcag gctgcgcaac tgttgggaag 8460 
ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 8520 
ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 8580 
gtgccaagct tttggctaga gcagcttgcc aacatggtgg agcacgacac tctcgtctac 8640 
tccaagaata tcaaagatac agtctcagaa gaccaaaggg ctattgagac ttttcaacaa 8700 
agggtaatat cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcaaa 8760 
aggacagtag aaaaggaagg tggcacctac aaatgccatc attgcgataa aggaaaggct 882 0 
atcgttcaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 8880 
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgataac 8940 
atggtggagc acgacactct cgtctactcc aagaatatca aagatacagt ctcagaagac 9000 
caaagggcta ttgagacttt tcaacaaagg gtaatatcgg gaaacctcct cggattccat 9060 
tgcccagcta tctgtcactt catcaaaagg acagtagaaa aggaaggtgg cacctacaaa 9120 
tgccatcatt gcgataaagg aaaggctatc gttcaagatg cctctgccga cagtggtccc 9180 
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 9240 
tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacgc acaatcccac 9300 
tatccttcgc aagaccttcc tctatataag gaagttcatt tcatttggag aggacacgct 93 60 
gaaatcacca gtctctctct acaaatctat ctctccatgg catgttctgc aggtcgactc 9420 
tagaggatcc ccgggtaccg agctcgaaga tcttcgacgt cggaattcat ggactcaaag 9480 
tcggttactc cagaaccaac caaccccttc tacgcttctt cggggcaatc aggaaaaacc 9540 
tatgcttctg ttgtcgccgc cgctgctgct gcagccgccg ataaggagga tggtggtgct 9 600 
srtgagtagtg ccaaggagtt ggattcctca tcggaggctg tgtctggtaa ttcggataag 9660 
gttggagctg atgatttatc tgactccgag aaggagaagc cgaatttggt gggtgatggg 9720 
aaggtttccg acgaggtgga tggttcttta aaggaggatt ctactactcc tgaggctact 9780 
ccgaagcctg aggtggtttc tggtgagaca attggtgtag atgatgtttc atcgttatct 9840 
ccgaagccgg aggctgtttc tgatggtgta ggggttgtgg aggagaataa gaaggttaag 9900 
gaggacgtgg aggatattaa agacgatggt gagagtaaga ttgaaaatgg gagtgttgat 9960 
gttgatgtga aacaggcttc cacagatggg gagagtgaga aagcttccaa cacttgtcac 10020 
tactttctct tatggtgttc aatgcttttc aagataccca gatcatatga aacggcatga 10080 
cttcttcaag agcgccatgc ctgagggata cgtgcaggag aggaccatct tcttcaagga 10140 
cgacgggaac tacaagacac gtgctgaagt caagtttgag ggagacaccc tcgtcaacag 10200 
gatcgagctt aagggaatcg atttcaagga ggacggaaac atcctcggcc acaagttgga 10260 
atacaactac aactcccaca acgtatacat catggccgac aagcaaaaga acggcatcaa 10320 
agccaacttc aagacccgcc acaacatcga agacggcggc gtgcaactcg ctgatcatta 103 80 
tcaacaaaat actccaattg gcgatggccc tgtcctttta ccagacaacc attacctgtc 10440 
cacacaatct gccctttcga aagatcccac cgaaaagaga gaccacatgg tccttcttga 10500 
gtttgtaaca gctgctggga ttacacatgg catggatgaa ctatacaaac atgatgagct 10560 
ttaaggatcc ttaaagctca tcatgtttgt atagttcatc catgccatgt gtaatcccag 10620 
cagctgttac aaactcaaga aggaccatgt ggtctctctt ttcggtggga tctttcgaaa 10680 
gggcagattg tgtggacagg taatggttgt ctggtaaaag gacagggcca tcgccaattg 10740 
gagtattttg ttgataatga tcagcgagtt gcacgccgcc gtcttcgatg ttgtggcggg 10800 
tcttgaagtt ggctttgatg ccgttctttt gcttgtcggc catgatgtat acgttgtggg 10860 
agttgtagtt gtattccaac ttgtggccga ggatgtttcc gtcctccttg aaatcgattc 1092 0 
ccttaagctc gatcctgttg acgagggtgt ctccctcaaa cttgacttca gcacgtgtct 10980 
tgtagttccc gtcgtccttg aagaagatgg tcctctcctg cacgtatccc tcaggcatgg 11040 
cgctcttgaa gaagtcatgc cgtttcatat gatctgggta tcttgaaaag cattgaacac 11100 
cataagagaa agtagtgaca agtgttggaa gctttctcac tctccccatc tgtggaagcc 11160 
tgtttcacat caacatcaac actcccattt tcaatcttac tctcaccatc gtctttaata 11220 
tcctccacgt cctccttaac cttcttattc tcctccacaa cccctacacc atcagaaaca 11280 
gcctccggct tcggagataa cgatgaaaca tcatctacac caattgtctc accagaaacc 11340 
acctcaggct tcggagtagc ctcaggagta gtagaatcct cctttaaaga accatccacc 11400 
tcgtcggaaa ccttcccatc acccaccaaa ttcggcttct ccttctcgga gtcagataaa 11460 
tcatcagctc caaccttatc cgaattacca gacacagcct ccgatgagga atccaactcc 11520 
ttggcactac tcacagcacc accatcctcc ttatcggcgg ctgcagcagc agcggcggcg 11580 
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acaacagaag cataggtttt tcctgattgc cccgaagaag cgtagaaggg gttggttggt 11540 
tctggagtaa ccgactttga gtccatg 11667 

<210> 123 
<211> 36 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreib-ong der kunstliclxen Sequenz : 
oligonucleotidle primer 

<400> 123 

ctcgaggaat tcatggactc aaagtcggtt actcca 3 6 

<210> 124 
<211> 40 
<212> DNA 

<213> Kunstliche Sequenz 

<220> 

<223> Besclireibung der Iciinstlichen Sequenz: 
oligonucleotide primer' 

<400> 124 

ggatccataa gcaagctttc tcactctccc catctgtgga 40 

<210> 125 
<211> 26 
<212> DNA 

<213> Kiinstliclie Sequenz 
<220> 

<223> Beschreibung der Iciinstliclien Sequenz: 
oligonucleotide primer 

<400> 125 

aagcttccaa cacttgtcac tacttt 26 

<210> 126 
<211> 26 
<212> DNA 

<213> Kunstliche Seq[uenz 
<220> 

<223> Beschreibimg der Joinstlichen Sequenz: 
oligonucleotide primer 

<400> 126 

ggatccttaa agctcatcat gtttgt 26 
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